DevOps研发效能
媒体矩阵
开源中国APP
授权协议 MIT
开发语言 Python
操作系统 Windows
软件类型 开源软件
开源组织
地区 不详
投 递 者 不详
适用人群 未知
收录时间 2025-04-27

软件简介

UFO 现已升级为UFO²(Desktop AgentOS),这是可在 Windows 桌面操作系统上运行的新一代代理框架。它旨在跨多个应用程序自动化协调任务,使用户能够使用自然语言命令与其操作系统无缝交互,而不仅仅是UI 自动化

关键功能

特性 描述
Deep OS 集成 结合 Windows UIA、Win32 和 WinCOM,实现一流的控制检测和本机命令。
画中画桌面 (即将推出) 自动化在沙盒虚拟桌面中运行,因此您可以继续使用主屏幕。
Hybrid GUI + API Actions 在可用时选择本机 API,在不可用时则回退到点击/击键——快速且强大。
Speculative Multi‑Action 将几个预测步骤捆绑到一次 LLM 调用中,并进行实时验证——查询量减少高达 51%
Continuous Knowledge Substrate 通过 RAG 混合文档、Bing 搜索、用户演示和执行跟踪,供代理随着时间推移进行学习。
UIA+视觉控制检测 使用混合 UIA + 视觉管道检测标准和自定义控件。

架构概述

UFO² 作为桌面代理操作系统运行,包含一个多代理框架,其中包括:

  1. HostAgent  解析自然语言目标,启动必要的应用程序,启动/协调 AppAgents,并引导全局有限状态机 (FSM)。
  2. AppAgents — 每个应用程序一个;每个运行一个 ReAct 循环,具有多模式感知、混合控制检测、检索增强知识以及在 GUI 操作和本机 API 之间进行选择的Puppeteer执行器。
  3. 知识基础 — 将离线文档、在线搜索、演示和执行跟踪融合到可在推理时动态检索的矢量存储中。
  4. 推测执行器 — 通过预测批量可能的操作并一次性根据实时 UIA 状态进行验证,大幅减少 LLM 延迟。
  5. 画中画桌面 (即将推出)— 在独立的虚拟桌面中运行代理,这样您的主工作区和输入设备就不会受到影响。
展开阅读全文

代码

的 Gitee 指数为
超过 的项目

评论

点击引领话题📣 发布并加入讨论🔥
发表了资讯
04/27 11:42

微软发布全新 Agent 操作系统 UFO²,深度整合 Windows 与智能自动化

微软宣布重磅升级其开源项目 AgentUFO,推出了全新的 UFO² 版本,该版本新增了操作系统功能,并与 Windows 系统实现了深度集成。此举不仅增强了自动化任务的执行效率,还使得用户能够更便捷地进行复杂操作。 UFO² 的一个显著特点是其能够直接调用 Windows 的原生 API 和 COM 接口。这种方式相比传统的机器人流程自动化(RPA),能够在执行复杂业务时更加高效且精准。例如,在 Excel 中将表格数据转换为图表,传统 RPA 需要模拟...

0
4
没有更多内容
加载失败,请刷新页面
点击加载更多
加载中
下一页
发表了博客
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
发表了问答
{{o.pubDate | formatDate}}

{{formatAllHtml(o.title)}}

{{parseInt(o.replyCount) | bigNumberTransform}}
{{parseInt(o.viewCount) | bigNumberTransform}}
没有更多内容
暂无内容
暂无内容
0 评论
3 收藏
分享
OSCHINA
登录后可查看更多优质内容
返回顶部
顶部