开源大模型AI代理操作系统：像Windos一样，操控AI代理

　　发布于2024-12-28　阅读（0）

扫一扫，手机访问

本文经AIGC开放社区授权转载，转载请联系出处。

想了解更多AIGC的内容，请访问：51CTO AI.x社区

https://www.51cto.com/aigc/

去年，AutoGPT的出现让我们认识到了AI代理强大的自动化能力，并开创了一个全新的AI代理赛道。但在子任务调度、资源分配以及AI之间协作还有不少的难题需要解决。

因此，罗格斯大学的研究人员开发了AIOS，这是一种以大模型为核心的AI代理操作系统。可有效解决随着AI代理的增加，资源调用率低的难题，同时能促进代理之间的上下文切换、实现并发代理并维护代理的访问控制。

开源地址：https://github.com/agiresearch/AIOS

论文地址：https://arxiv.org/abs/2403.16971

开源大模型AI代理操作系统：像Windos一样，操控AI代理

AIOS的架构和我们使用的PC操作系统差不多，主要分为应用层、内核层和硬件层三大块。唯一不同的是，AIOS在内核层中构建了一个专门管理与大模型相关任务的内核管理器。

开源大模型AI代理操作系统：像Windos一样，操控AI代理

应用层，主要由代理应用程序构成(例如，旅行代理、数学代理、代码代理等)；内核层由传统OS系统和大模型相结合开发，OS系统主要用于文件管理，大模型则用于AI代理的调度和管理；

硬件层由CPU、GPU、内存和外设等硬件设备构成，但是大模型的内核无法与硬件直接交互，而是通过内核层提供的调用来间接管理硬件资源,以确保系统完整性和效率。

AI代理调度器

AI代理调度器主要负责对大模型的代理请求进行合理调度和优化,以充分利用大模型的计算资源。当多个代理同时向大模型发起请求时,调度器需根据特定调度算法对请求进行排序,避免单一代理长时间占用大模型而导致其他代理长时间等待。

此外，AIOS的设计还支持更复杂的调度策略,例如，考虑代理请求间的依赖关系,以实现更优化的资源分配。

在没有调度指令时,代理需按顺序逐一执行任务,后续代理需等待较长时间;而采用调度算法后,各代理的请求能够交错并行执行,显著降低了整体等待时间和响应延迟。

上下文管理器

由于大模型生成过程普遍采用Beam Search等启发式搜索,会逐步构建搜索树并评估不同路径最终给出结果。

但在生成过程中大模型若被调度器中断，为避免所有中间状态丢失而浪费之前的计算,上下文管理器会对当前的Beam Search树状态(包括各路径概率等)进行快照保存。

开源大模型AI代理操作系统：像Windos一样，操控AI代理

当大模型重新获得执行资源后,上下文管理器能够准确地从中断处恢复之前的Beam Search状态,继续生成剩余部分,确保最终结果的完整性和准确性。

此外，多数大模型存在上下文长度限制,而实际场景中的输入上下文往往会超出该限制。为解决这一难题,上下文管理器集成了文本摘要等功能,能够对过长的上下文进行压缩或分块处理,使大模型能够高效理解并处理长上下文信息。

内存管理器

内存管理器主要负责管理短期内存资源,为每个AI代理的交互日志和中间数据提供高效的临时存储。

当AI代理处于等待执行或正在运行状态时,其所需的数据将被保存在由内存管理器分配的内存块中。一旦代理任务结束,相应的内存块也会被系统回收,以确保内存资源的高效利用。

开源大模型AI代理操作系统：像Windos一样，操控AI代理

AIOS会为每个AI代理分配独立的内存,并通过访问管理器来实现不同代理之间内存隔离。未来，AIOS会引入更复杂的内存共享机制和层级缓存策略,以进一步优化AI代理的整体性能。

想了解更多AIGC的内容，请访问：51CTO AI.x社区

https://www.51cto.com/aigc/

本文转载于：https://www.51cto.com/article/785385.html 如有侵犯，请联系admin@zhengruan.com删除

上一篇：小米SU7上市受热捧，交付时间最长或达6个月

下一篇：骨伽推出星舰 FV270 海景房机箱：黑白双色，首发价 889 元起

产品推荐

售后无忧
立即购买>

DAEMON Tools Lite 10【序列号终身授权 + 中文版 + Win】

￥150.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Ultra 5【序列号终身授权 + 中文版 + Win】

￥198.00
office旗舰店
售后无忧
立即购买>

DAEMON Tools Pro 8【序列号终身授权 + 中文版 + Win】

￥189.00
office旗舰店
售后无忧
立即购买>

CorelDRAW X8 简体中文【标准版 + Win】

￥1788.00
office旗舰店

正版软件

阿里巴巴：淘天集团对商家来说综合能力最强，总变现率提升空间大

截至2024年财年第三财季财报，阿里巴巴发布了截至2023年12月31日的2024财年第三财季财报：营收为2603.48亿元，同比增长5%。净利润为107.17亿元，同比下滑77%；不按美国通用会计准则，净利润为479.51亿元，同比下滑4%（注：阿里财年与自然年不同步，2023年4月1日至2024年3月31日为2024财年）。财报发布后，阿里巴巴集团董事会主席蔡崇信，CEO吴泳铭，CFO徐宏，以及阿里国际数字商业集团（AIDC）CEO蒋凡出席了随后召开的电话会议，对财报进行了解读，并回答了分析师提问。以

12分钟前阿里巴巴 0
正版软件

问界M9推送6.65GB系统升级，多项功能优化

2021年4月21日消息，近日，问答社区M9车型向用户推送了V4.2.1.4版本的更新。此次更新软件包体积达到了6.65GB，不仅在功能上有所新增，还对一些现有功能进行了优化。据悉，这次更新为问答M9带来了多项引人注目的新功能。其中包括智能交互矩阵大灯情景灯语功能，为驾驶者提供了更丰富的交互体验。同时，新增的ADS双3D视图功能使得驾驶者能在仪表和中控屏上同时查看ADS3D视图，提升了驾驶的便捷性和安全性。此外，还加入了后视摄像头清洗功能，以及对侵占车道障碍物主动避让、错误踩油门提醒等智能驾驶辅助功能，无

22分钟前问界 0
正版软件

消息称英特尔考虑引入 DSA 技术辅助 High NA EUV 光刻，提升图案质量

本站4月19日消息，综合外媒SemiAnalysis和TheElec报道，英特尔考虑在未来的HighNAEUV光刻节点导入定向自组装DSA技术进行辅助。DSA是一项被认为可部分取代传统光刻的新型图案化技术之一（本站注：另一项是纳米压印NIL），其利用嵌合共聚物的分子特性实现图案化。一般被认为适合辅助传统光刻而非独立运用。▲嵌段共聚物分子在诱导下可自动排列成有规律的图案形态。图源德国默克SemiAnalysis认为，HighNAEUV光刻面临的一个大问题就是关键尺寸（CD，衡量半导体工艺精细程度的关键指标）

37分钟前英特尔 DSA 先进制程 High NA 定向自组装 0
正版软件

OKB币是什么？OKB币的工作原理是什么？

OKB币是OKX平台发行的平台币，基于OKChain公链，具有以下应用场景：支付交易费用、抵扣手续费、参与OKJumpstart、质押挖矿等。持有一定数量的OKB币可享受权益激励，如手续费折扣、投票权、空投福利、参与生态治理等。OKChain是OKB币基于的公链，采用PoS共识机制。用户可以通过交易、质押、活动和空投获取OKB币。OKB币：助力OK生态，解锁更多权益OKB币是OKX平台发行的平台币，基于OKChain公链，旨在为OKX生态系统提供动力。OKB币拥有以下特性：多场景应用：OKB币可在OKX生

52分钟前 0
正版软件

好低调！字节Dreamina全面开放内测了，效果够惊艳吗？Ta眼中的“Sora女士”原来是这样！

Dreamina的内测范围扩大了！一个月前小编填写过一次内测收集问卷，当时并未达到最初100人（据说）的名额。图片但在今天上午再次申请后，下午便惊喜地发现已经开通了Dreamina的文生视频功能！申请只需选择两个问题，一个是有无AI视频产品的使用经验，另一个是是否在工作中大量使用AI视频生成的需求。完成后即可等待上手测试！想体验的朋友们移步“视频生成”选项即可：https://dreamina.jianying.com/ai-tool/home。最最让我好奇的还是：Dreamina眼中的“Sora女士”会

1小时前 19:10 内测 Sora Dreamina 0

开源大模型AI代理操作系统：像Windos一样，操控AI代理

AI代理调度器

上下文管理器

内存管理器

产品推荐

最新发布

相关推荐

热门关注