聊一聊OAI Swarm和多智能体

文摘 2024-10-13 16:10 浙江

最近OAI开源了一个叫SWARM^[1]的多智能体项目, 挺有意思的. 作者还有一篇博客介绍《Orchestrating Agents: Routines and Handoffs》^[2]

对于多智能体(Multi-Agent)的协同编排是一个非常有趣的话题, 然后Routines和Handoffs又有点操作系统进程间切换的感觉, 似乎构成了一个新的LLMOS的雏形了? 有了输入输出,多任务编排调度, 进程切换等? Tokens as File? POSIX interface是什么呢?

Multi-Agent并不是什么新东西, 这不还有Swarm Corportation的创始人Kye Gomez发了一大堆推文控诉OAI剽窃.

其实吧, 多智能体的框架叫Swarm的二十年前就有了, 渣B 20年前就在用Swarm多智能体做股市仿真交易的研究.

当时桌上的这本书就是

通过多智能体的博弈来获得一个GroundTruth蛮有趣的, 例如当时渣B把投资者分为:专业投资者, 投机者, 跟风韭菜等多个角色, 每个投资者有一个可以动态根据行情更新的状态转移矩阵来决定自己买卖股票的概率, 然后构建了百万级的Agents,并通过一个符合幂律分布的随机图来进行消息传递, 最后对市场上的ETF300的股票进行仿真交易来预测市场在极端宏观因素影响下的走势.

而现在, 智能体的算法已经由单个状态转移矩阵变成了LLM, 这会是一件非常有趣的事情, 例如仿真十亿个智能体, 然后灌入通过大模型产生一些关于市场的评论让它们根据外在信息在仿真市场内撮合交易,特别有趣.

话说最近收到国外一个高频交易机构的邀请, 感叹现在勾引人不说自己有个很大的GPU Farm都不好意思开口....

谈谈GPU架构和智算中心

话说恰逢NV GeForce 256发布25周年, 然后回过头去看看《GPU架构演化史3: 1994-2000 群魔乱舞》

那个年代, 图像处理的流水线相对固定后

3Dfx的成功在于廉价的EDO内存和纹理处理的Offload来降低CPU的内存带宽需求, 而GeForce256的成功则是将定点处理和几何变换处理的算力Offload到GPU

逐渐蚕食CPU的路径非常明显, 那么未来呢? GPU本身在Compute和Memory Bound的时候该怎么做呢? GPGPU的故事讲了也快20年了,而NV随着光追开启在图形处理上又开始DSA化, 在计算上也逐渐的越来越难编程, 未来呢? 来个民科暴论:“GPU也会逐渐被一种新的体系结构的东西蚕食掉, 但很慢大概也需要8~10年” 而在这些快速的变革中, 投资回报率如何计算? 听说有的厂商已经开始卖卡了不高Pre-Train了. 而看到SemiAnalysis的一个报告, H100租金降低到2美元/时, 低的1.5都有. 随着B200的逐渐上市, 这些大量的H100的小型“智算中心”如何变现? 特别是国内疯狂建设的一些智算中心?

参考资料

[1]

swarm: https://github.com/openai/swarm

[2]

Orchestrating Agents: Routines and Handoffs: https://cookbook.openai.com/examples/orchestrating_agents

zartbot

随便记录点有趣的东西

最新文章

推测一下Nvidia Rubin的288卡系统架构

AWS Re:Invent 从AWS CTO演讲的教训看AI云基础设施架构

AWS Re:invent GenAI路上快速的追赶者, 详细谈谈Trainium2/3架构

AWS Re:invent一场教科书级的“科普”

从Mooncake分离式大模型推理架构谈谈RDMA at Scale

中国大模型的生存战?

抄袭与创新

谈谈端侧AIPC网络安全的一个场景

ScalingLaw终结了么?

谈谈UEC和UALink是否融合以及协议设计相关的问题

再来谈谈未来AI基础设施演进和EthScaleUP

推荐一本《Streaming Systems》的书

谈谈大模型算法和基础设施的演进...

再来谈谈ScaleUP网络

算力通缩下的“老黄经济学”

把GPU当成一个金融产品如何上杠杆?

继续谈谈三万亿的破绽

聊一聊OAI Swarm和多智能体

敬畏市场, 但是还是要充满希望~

再谈谈A股风险教育以及英伟达挖了思科AI网络的头牌Fellow的八卦

谈谈上交所指定交易, Meta Movie Gen和GPU微架构

Option-001: 谈谈A股的风险管理

谈谈A股量化中性及期权策略和上交所故障

谈谈CoT和推理的Scaling Law

致敬小镇做题家的OpenAI o1

随性摸鱼: 谈谈TTPoE和ScaleUP以及HMC

Tensor-010 Tensor Copy

Tensor-009 Cute Tensor

HotChip2024后记: 谈谈加速器互联及ScaleUP为什么不能用RDMA

Tensor-008 CuTe Layout代数

HotChip2024-Day2: AI加速器互联和云AI处理器, Tesla是亮点

HotChip2024-Day1:AI加速器芯片

Tensor-007 Cute Layout简介

Tensor-006 AI软硬件交互界面: 可组合的Kernel

谈谈AI的软硬件交付界面

Tensor-005 CUTLASS简介

期待一下今年的HotChips

基于EthZ的以太网ScaleUP互联方案

谈谈下一代AI训练网络架构

[Sigcomm2024论文解析]谈谈网络研究和工程方法

Tensor-004 TensorCore编程及优化

[Sigcomm论文解析] Llama 3训练RoCE网络

Tensor-003 TensorCore架构

再来谈谈AI落地的事情

Llama 3技术报告解读(1)- AI基础设施和并行策略

Tensor-002 矩阵乘法优化

Tensor-001 矩阵乘法分块乘法概述

谈谈AISys架构师的基本素养

再来谈谈AI Fabric,你是计党还是网党?

谈谈AI Fabric, bus with network ?

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉