「关键词:设备、智能、认知、个体、程序员、微软、物理、虚拟、客户、智能家居、操作系统、语言模型、技术框架、创业公司、细分行业、自然语言、开发流程、物联网系统」
本次谈话内容由播客「遇见AIer」供稿,彩虹之眼删减整理~
嘉宾背景:陈永立,创业公司边无际CEO,获得奇迹投资,在美国完成了物理以及电子工程的双学位本科学习后,又深入计算机科学的硕士研究.经历博士期间创业,最后公司被成功收购。
职业生涯随后转向了微软,参与云计算领域的工作,并参与构建GPT-2语言模型的底层基础设施。也是这段经历让他深刻认识到大语言模型在泛化能力上的优势,坚信这是推动人工智能发展的关键方向。
在微软的丰富经验让陈永立洞察到智能物联网市场的巨大潜力。并提出洞察,如果把AI模型比作大脑,IoT设备比作身体,我们则缺少了一套有效的神经网络来实现AI模型与设备间的互联互通。
这一洞察催生了他的再次创业——边无际「Shifu」,一个利用AI技术解决IoT设备互操作性难题的项目。「Shifu」不仅提升了具身智能应用的构建速度,还在实际项目中展现了其惊人的效率:一个原本需要十多人耗时两年的项目,在「Shifu」的帮助下,仅需两人两个月即可完成。
对于个人用户来说,陈永立已经在自己的家里通过「Shifu」将不同厂商的IOT设备链接到同一个网络,通过GPT4统一控制,这大幅的提升了他们家IOT网络的智能。
在AI工具的应用上,陈永立是GitHub Copilot早期的尝试者之一。他认为,如果自己仍然在工程师岗位上,大约70%的代码可能将由AI自动化完成。鼓励自己的员工使用AI工具来提升工作效率,并强调程序员需要掌握对大模型的Benchmark能力,这不仅能帮助他们评估和选择最合适的AI工具,也是适应未来技术发展的关键。
谈到程序员的职业发展建议:尽可能选择与AI相关的工作,参与AI原生项目的开发。在AI时代,个人将能够以前所未有的方式提供服务、创造价值,甚至一人运营一个高效的公司。但这背后需要足够的AI知识和对细分行业的深刻理解。
以下是本次对话整理内容:
佘洪宇
您先详细介绍一下你的项目:边无际
陈永立
我认为边无际其实是一个具身智能的操作系统,就是怎么理解这件事呢?如果把 AI 比作大脑,IOT 设备比作身体的话,其实大家都会这个忽略一个非常重要的这个器官或者说组件,那就是神经。如果没有神经的话,你怎么能做这个上传下达的大脑指挥身体的这些是一些事呢?所以我们其实做的是这一块。
佘洪宇
你做的其实是把大语言模型的一些指令或者决策翻译给 IoT 设备的这个中间的传达系统。
陈永立
对,这是很重要的一部分,我们说理想中这个 AI 系统大概是个什么样的?应该是一个感知决策执行有三步,就比如说感知,我就是我的五感,眼睛我看到什么东西;然后决策,就是到我的大脑里边去处理;然后最后执行来再控制我的手脚。我去该做什么。所以就是这个,怎么把这个说白了?就是脑子和这个手脚打通,这件事是我们在做的,他可他既可以把这个数据收集过,收集来给AI,也可以反过来把 AI 的指令传给物理设备。
佘洪宇
你是如何从 AI 这个领域跳到了去做?跳到了做神经系统这个工作?到底是什么事情激发了你?
陈永立
首先第一点就是说我其实当时在做 AI 的这一部分的话,我也不是在做模型本身,当时是在做这个 AI Infra,所以其实本身的这个 skill set 还是很类似的,就是在做Infra。
然后另外一点就是说其实当时我在微软的时候,其实公司有一个很大的这个战略类的变化,就原来叫移动为先,云为先,后面战略有一个大的调整,叫智能云和智能边缘。然后智能这个事就不用讲了,就是AI.后来就加了一个叫智能边缘,就是云还在那,只是加了一个边缘,然后智能边缘是后来我也觉得这个挺有意思的,然后我就去研究,然后边缘其实代表的就是边缘计算。
因为微软这么大一个公司战略不可能是随便定的。他如果把它提升到了战略级的层面的话,它一定是一个非常重要的这个市场。所以我就觉得这个边缘计算可能是非常值得去研究。后来我就研究发现边缘计算里边其实最大的问题就是物联网的互操作性,也就是说这个各种设备的协议标准都不一样,也就是说你要是想基于它去开发任何东西,其实是一个非常困难的事。
所以后来我就觉得这是一个最应该解决的问题之一,然而物联网本身就是一个巨大的长尾市场,这个 AI 又特别适合解决长尾问题。然后我就觉得这个结合AI,再加上我原来的一些云原生的技术就特别适合做这件事,觉得那就是过来,然后直接去干了.
佘洪宇
有点像我们现在做各种手机系统或者是车机系统,都在提一个叫AIOS,但是这个都是基于软件层的一个AIOS,您可能是在做的更底层的,不同设备之间的这一个神经网络。
陈永立
它可能是在 AIOS 更底层一点,然后就相当于你可以理解为它把所有的设备全都抽象掉了,就是不用管那些不同设备之间的差异化这些事了。
佘洪宇
因为我看到你的客户有一些船舶公司
陈永立
一般就是这个工业、能源、农业、海洋行业用的比较多一点。
佘洪宇
你的这个客户一般都是一些特大型的物联网系统公司,大型的物联网系统。目前来说你这套系统在他们这套系统里面能够对他们起带有多大的帮助?比如说对他们的工作效率带来多大提升,或者是提升多少信息传达效率?
陈永立
逻辑上是客户的那个设备越多越杂,我们就越有优势,举一个具体的例子,我们帮助做的一家自动化的生物工厂,它原来大概是十几人,十几个人要干两年的一个活,然后呢?用了我们以后变成两个人,两个月。这个其实还是一个挺大的提效。
佘洪宇
为什么会有这么大的提效?
陈永立
驱动是一方面,然后就是驱动写完了以后,它实际上还是要装到一个操作系统,就像 Windows 一样的东西里面。那么就是这个「Shifu」本质上一个所谓的分布式的操作系统,然后它跑在比如说一个场景机柜里边或者一个数据中心里边,然后他通过网络协议或者其他的这种协议来跟这些设备进行沟通。所以开发驱动的一部分工作确实省掉了一些,但是更多的实际上是怎么能让这些驱动在一起,然后在一个环境里面工作,工作的比较好,比较稳定。
佘洪宇
说到这样的大型的行业的操作系统,可能对于我们的读者来说会比较陌生,但是有一个和我们生活更接近的领域就是我们的家。所以这种越来越多的智能家居被投放到家里,我们可能会感觉到操作不过来,您的这套系统是否有可能对于像这样的一个小规模的 IOT 网络带来一个?
陈永立
我在自己家里就已经部署了这么一个系统,虽然做得不完善,就是因为也没有太多的时间去做太多的开发,但是其实现在达到的一个效果就是把 GPT 通过「Shifu」接到了这个智能家居上面,然后我现在可以在 ChatGPT 上打字,然后打完字以后他就可以开窗帘、关窗帘,或者我说,我困了想睡觉,他就自己能把我窗帘给关上,比如说把灯给关上,这都是可以的。
佘洪宇
您之前对比过其他的,比如说像苹果智能家居系统,或者小米的智能家居系统,您这套系统和他那些系统有本质的差异,有什么体验上的提升?
陈永立
其实我觉得本质的差异其实没有,但是体验上的提升在主要在于两点,第一点在于就是因为「Shifu」的这个兼容性是可以对接各种各样的设备的,就比如说我要控制小米的,我就得用个米家,我要控制美的,就需要再装美的,就这样的话就是否可以统一的来管?另外一个方面就是比起之前传统AI,其实我这现在直接是 GPT4 了,所以更智能一些.
佘洪宇
所以说「Shifu」目前虽然说本质上没有太大变化,但是它的智能性因为你接入的是 GPT 4,所以它有了一个对非常大的提升,比如说对语义的理解以及泛化能力。
佘洪宇
对,我也参与过一些 LOT 项目,这些 IoT 项目有一个问题,就是一个家庭里面可能有几十上百个 IOT 设备,如果说你全用这一套的话,然后就会发现一个问题,每一个设备上来的数据要不要监听?要不要处理?那如果要做一些相应的反应,就需要设定一套相应的场景,而用户在不同时间段,比如说春天和夏天对这些场景的需求是不一样的,所以就导致这个场景的设计会非常复杂,我不知道,就是说您的「Shifu」这套系统,或者说是在 AI 时代有没有一些解决方案,可以解决这样的问题。
陈永立
我觉得其实可以,我不知道大家了不了解,就是现在大家去 train AI 的时候,不都是就是比较简单的办法,就是这个所谓的 feel shot,对吧?我就这个输入出,我给你几组,然后他大概就是这种大语言模型他就能学会了啊。
佘洪宇
看到有些用户并不会去那么花那么多精力去思考这些场景该如何构建。那对真实用户来说,你即使给他提供了一个简单的一个方式,他的学习门槛还是很高。
陈永立
如果这样的话,那就得再往前再进一步,就相当于怎么说呢?其实就是基于大模型自己的这个推理能力,然后来把这个场景是完善设定好,当然肯定还是有一些基础的框架的,就比如说我春天我可能大概率就是不用不用开空调或之类的。也会有一些技术的框架,我们其实比如说作为厂商或者提供商是可以设定好的,然后再往上一步,那定制化的东西基于大模型的这个推理能力其实是可以做到。
佘洪宇
您觉得这样的一个未来可能会是在多少时间以后可以做到?还是说现在模型就有这个能力了?只不过成本太高?
陈永立
我觉得其实是有这个能力的,也不是成本太高的问题。我觉得目前好像没有太多人有付费意愿在这上面,所以大家没有太大的动力去做这件事,但实际上技术已经可以触达到了。
佘洪宇
澜码科技的周建老师跟我们分享的说,在一个大型的应用里面,即使一个专家可能也只能掌握其中 100- 200 个功能。那其实我认为在 IOT 领域也是接近的,你一个空间里面,人真正能记住或者能使用到的功能也就那几十个,如果说 AI 能把它串起来,有机会大幅的提升我们这个空间里面容纳这些设备的上限,我觉得可能这才是它的价值。
陈永立
这个是一个非常好的认知,我之前也没这么想过,但是这个确实给我打开了这个很好的思路,非常感谢。确实有一些客户是可以大幅的增加它的 IOT 设备,因为它的这个接入和开发流程变得非常标准化,而不是原来的定制化.
佘洪宇
您认为 AI 会对程序员的工作带来一个怎样的影响?您会给新入行的程序员什么建议?
陈永立
我觉得比较重要的就是你作为一个程序员实际上要掌握一些这个对于这些大模型的这个 Benchmark 的能力,就是说我在做一件事的时候,我想去同时用多个大模型,然后我看看哪个大模型最适合解决这个问题。云厂商都有很多这些比较易用的工具,可以让大家甚至免费的体验去对比多个大模型。
第一点一定要把 AI 融入我们的工作生活中,利用好这个工具,如果有机会的话,尽量去找一些就是 AI 开发的岗位。因为这个其实是一个已经是非常确定的趋势。如果不开发 AI 的话,就很有可能在未来岗位受到很大的调整。
佘洪宇
你觉得怎么样才能算一个 AI 原生的应用?
陈永立
其实我觉得这个定义肯定也还是算模糊的,但是逻辑上来讲就是说最简单的,比如抖音,我就认为它就是一个 AI 原生,因为它的核心竞争优势其实是来自它的体验,来自于 AI 给你的推荐算法,这个其实是它最核心的点。那么如果我觉得要做一个C端应用,然后他的体验个性化,那大概率这个就是 AI 原生应用.
佘洪宇
请问一下您对超级个体的看法是什么样的?如何成为这样的超级个体?
陈永立
就是首先我觉得如果想做这样的话,不能做大b的生意,我觉得对于销售的要求还是非常高的,就是说他要有专业性的销售团队来打配合,所以这件事如果你超级个体做大b的生意是不太现实。
SMB 我觉得是现实的,比如说一个人,我做SaaS 也好,或者是什么样的东西也好,然后去这个标准化地服务, SMB 这个我觉得是可以的。然后 c 端的这种超级个体,其实我个人感觉可能会比较困难,为什么呢?我也可能说得不对,但是我的感觉就是如果 c 端你真的一个产品做到了所谓这个 PMF product market fit 的时候,然后你需要有非常大量的资源投入,来保证你能有一个高速的扩张和保持你的领先优势。
那这个时候如果你要非得坚持就一个人干。然后对面就是有可能有一个完全抄你的,然后他投了 1, 000 个人干,就这个这件事,我觉得就对于这个超级个体的这个逻辑,在这个 c 端这可能说不太通。而且得尽量细分一点。就是像刚才说的不能是一个巨大的市场。你要是一个巨大市场,就比如说就像我这,我要做一个什么聊天软件,我要颠覆微信,就是你这个超级个体要跟腾讯一个公司去竞争,你肯定没有大的胜算.
佘洪宇
想要成为这样的超级个体,你觉得一个 AI 时代的人需要怎样的能力呢?
陈永立
我感觉一定要有细分行业的认知,这个我觉得是最重要的一点,当然会用AI这个是基础就我们就不提了。但是要去你真的了解一个行业的结构,了解一个行业的痛点,了解行业的这个交易方式,这个我觉得是能把这件事做得像超级个体一样,就是很轻、很标准化的一些。
ps:突然想到面壁智能前几天抛出的一个IoA 自由注册、互相发现Agent协作平台 IoA将至,让全世界Agent联合起来!
「智能体互联网」(IoA)简洁版摘要(希望读者朋友有所收获)
Agent的丰富性和扩展性:IoA将会像互联网一样成为一个看不到边界的资源宝库。在IoA中,Agent的种类和能力会不断丰富,形成一个动态的、不断扩展的生态系统。这样的环境可以促进更多创新,并推动Agent的能力边界不断延展,就像互联网推动了信息的迅速传播和技术的快速进步一样。
从个体智能到群体智能:IoA的一个关键特点是将个体Agent智能体连接起来,从而形成集体智能。这种群体智能不仅可以在理论上更强大,而且在实践中可能会产生新的协作模式和解决方案。类似于自然界中的群体行为(如蚂蚁群体的合作),IoA中的Agent也可以通过合作实现更复杂的任务和功能。
智能体与物联网的结合:在未来,万物将成为Agent,每个物品都具备智能化理解,并通过互联网连接。这种结合将会彻底改变人类的生活方式,提升生活的便捷性和效率。例如,智能家居系统、智能交通管理等领域都可能因为Agent技术的引入而获得突破性的发展。
群体协作的“涌现”效应:在IoA的环境下,高度智能的个体进行群体协作,可能会产生新的涌现现象。群体智能的产生可能带来前所未有的创新和效能提升,同时也可能催生新的挑战和未知领域。你提到的“智慧大爆炸”或许可以理解为这种智能体网络中蕴含的巨大潜力和未被探索的可能性。
看到这里,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标哦!