Agent TARS 是字节跳动 Seed 团队开源的通用多模态 AI 智能体技术栈,包含 CLI 命令行、Web 网页端与 UI‑TARS 桌面客户端,支持自然语言操控电脑、浏览器、命令行、文件系统,可像真人一样完成点击、输入、浏览、搜索、填表、预订、数据分析等复杂任务。 基于 UI‑TARS
软件介绍 UI-TARS-desktop 是一个基于视觉语言模型的桌面GUI Agent应用,由字节跳动开源。它通过屏幕截图实时感知界面内容,并用自然语言指令控制电脑操作,如打开文件、浏览网页、点击按钮、输入文字、拖拽等。支持本地和远程电脑/浏览器操作,完全本地运行,无需云端依赖。核心一句话:UI