软件介绍 UI-TARS-desktop 是一个基于视觉语言模型的桌面GUI Agent应用,由字节跳动开源。它通过屏幕截图实时感知界面内容,并用自然语言指令控制电脑操作,如打开文件、浏览网页、点击按钮、输入文字、拖拽等。支持本地和远程电脑/浏览器操作,完全本地运行,无需云端依赖。核心一句话:UI-TARS-desktop 让AI像人类一样“看懂”并操作你的电脑,实现自动化任务执行。 核心参数 支持系统:Windows 10/11、macOS 12+、Linux(部分支持) 最低配置:8GB内存 + 支持GPU的C…
