AI Agent / AI 编程 / MCP / 工作流自动化
UI-TARS-desktop
字节开源的多模态 AI Agent 栈,连接前沿 AI 模型与 Agent 基础设施
质量分70
36,684 Stars
unknown
medium
中文速读
UI-TARS Desktop 是字节跳动开源的多模态 AI Agent 平台,包含两个子项目:Agent TARS(通用多模态 AI Agent,提供 CLI 和 Web UI)和 UI-TARS Desktop(基于 UI-TARS 模型的桌面 GUI Agent)。支持通过 MCP 工具集成真实世界能力,提供 GUI 自动化操作。适合需要 AI 辅助桌面操作、浏览器自动化或构建多模态 Agent 的开发者。注意 agent-tars.com 域名 SSL 证书有问题,文档可能无法访问。
快速试用
暂未发现稳定的 Demo 或视频入口。
适合
- 需要 GUI 自动化操作的开发者
- 想构建多模态 AI Agent 的团队
- 对字节系 AI 技术栈感兴趣的开发者
不适合
- 只需要文本聊天不需要多模态的用户
- 需要成熟产品化方案的企业
- 不习惯 CLI/Agent 工作流的用户
选型答案
UI-TARS-desktop 适合什么场景?需要 GUI 自动化操作的开发者;想构建多模态 AI Agent 的团队;对字节系 AI 技术栈感兴趣的开发者
UI-TARS-desktop 的试用和部署门槛如何?暂未发现稳定的 Demo、视频或文档入口,适合先从 GitHub README 和 issues 判断成熟度。 当前难度标记为“中等难度”,许可证记录为“unknown”。
选择 UI-TARS-desktop 时要注意什么?只需要文本聊天不需要多模态的用户;需要成熟产品化方案的企业;不习惯 CLI/Agent 工作流的用户
数据来源和更新时间GitHub 仓库 bytedance/UI-TARS-desktop,最近记录的推送时间为 。
标签
多模态AgentGUI自动化MCP字节跳动桌面Agent