🖱️ 微软首个视觉控制 AI 正式开源！7B 小模型“降维打击”，像人类一样操控电脑

udhtufyfe · 2026 年1 月 20 日 00:35

如果你以为 AI 自动化操作电脑 必须依赖千亿级参数的大模型，那么微软最新的开源力作 Fara-7B 将颠覆你的认知。

Microsoft 正式发布并开源了 Computer Use Agent —— Fara-7B。这款仅有 70 亿参数的“小钢炮”，在效率上直接吊打了众多巨型模型。

项目地址： microsoft/fara

核心突破：它不是在聊天，而是在“干活”

Fara-7B 是微软首个专为 Computer Use（电脑操作） 场景打造的 SLM（小语言模型）。它不依赖复杂的后台代码或脚本，而是像人类一样：看懂屏幕 → 移动鼠标 → 敲击键盘。

特性	详情描述
轻量化架构	仅 7B 参数，支持消费级显卡本地部署，响应极快。
纯视觉驱动	像真人一样“看”网页截图，不挑环境，兼容性极强。
低成本高效率	相比 GPT-4 等大模型，推理成本降低 90% 以上。
隐私数据安全	支持 Local Deployment，操作轨迹与敏感数据不出本地。

Fara-7B 已经进化到可以处理真实世界的复杂链路任务：

实验结果显示：不仅能打，而且是“登顶”。

在权威的 Web Agent 基准测试中，Fara-7B 展现了统治级实力：

结论： 在「电脑操作」这一垂直赛道，Fara-7B 是目前全球最强的 7B 级模型。

Fara-7B 极度友好，官方提供了多种部署方案：

Fara-7B 的开源释放了一个重要信号：
“AI 操控电脑”不再是大模型的专利。

它将成为：

一句话总结：Fara-7B 不跟你废话，它直接帮你把事儿办了。

立即前往 GitHub 体验 Fara-7B