独家直击Liquid AI发布会：非Transformer架构AI模型有了听觉和视觉｜甲子光年

科技 2024-10-25 16:45 北京

AI的未来不应受到限制，而应该是“Liquid”。

作者｜苏霍伊

北京时间10月23日，美国初创公司Liquid AI在麻省理工学院（MIT）的Kresge礼堂举办了产品发布会。揭晓了利用Liquid基础模型的首批企业级产品。

Liquid AI基于第一原理，打造出了一种非Transformer架构的动态引擎——液态神经网络（Liquid Neural Network,LNN）。通过将神经科学、物理学和动力系统的原理融入其模型设计中，Liquid AI在可解释性和效率方面实现突破。LFM模型采用了与数学和信号处理领域相似的数学原理，因此它们特别适合处理多种类型的数据，包括文本、音频、图像和视频。

诚然，OpenAI的ChatGPT和谷歌的Gemini可能正在引领人工智能革命，但这家小型初创公司也在用实力向世人证明，创新仍然具有颠覆性力量。

在昨日在宣传片中，Liquid AI的CEO Ramin Hasani更是直言“Liquid引擎才是真正的创新”。“它能让每家公司都拥有自己专属的AI解决方案，我们创建Liquid AI，是为了让人们能以更智能的方式接触GenAI。”他说道。

「甲子光年」发现，LFM的特点主要有：

提升决策质量：LFM拥有先进的知识处理能力，特别适合解决需要深度知识背景的任务，能在这些场景下展现出色的表现。

效率与可持续性：这些模型因为内存使用低和推理速度快而极具效率，训练和部署都能节省大量资源。此外，它们能在本地设备上高效运行，大大减少了对云计算的依赖，有助于降低成本和环境影响。

增强可解释性：与传统基于Transformer的模型相比，LFM的设计原理更加清晰，提供了更好的透明度，用户可以更容易地理解和监控模型的决策过程。

Liquid AI产品发布会现场，来源：「甲子光年」拍摄

Ramin Hasani表示：“Liquid AI让我们以全新的视角面对AI系统。我们将从底层改变AI。”

三周前，Liquid AI发布了首批基于液态神经网络的多模态大模型——Liquid Foundation Models（LFM），包括1.3B、3B和40B三个版本。这些生成式AI模型在各种AI任务中展现出优越性能，它们不仅具有较低的内存需求和更高的推理效率，同时在多个规模上都达到了行业领先的性能水平。

在发布会上，他们又推出了两款新产品——音频LFM和视觉LFM。

音频LFM拥有近40亿参数，能直接在设备上运行。它支持无缝音频生成，能进行语音到语音转换和语音到文本转换。视觉LFM能处理文本与图像，还能在图像上添加上下文，可以在边缘和本地使用这些新基础模块解锁许多应用。

它们可用于检测金融交易欺诈、控制自动驾驶汽车和分析基因数据等。三星、Shopify等公司正在测试这项技术。

Ramin Hasani特别提出Liquid“不仅仅是一种AI架构”。“我们确实在AI架构上取得了创新，但架构只是基础模型公司的一部分。我们正在构建一个完整的模型开发生态系统，不仅在架构上创新，还在学习算法、训练方式、评估方法等方面进行突破。”他说道。

Ramin Hasani，图片来源：Liquid AI

创始科学家Jimmy Smith介绍了Liquid AI是如何“拔高”模型质量的。“掌握知识能力、多步推理，并关注推理、训练的效率。在特定部署场景下，我们不仅仅关注模型架构，还考虑数据、训练算法和后期训练的相互作用。”Jimmy Smith说。

Jimmy Smith，图片来源：Liquid AI

高级科学家兼后期训练负责人Maxime Labonne介绍了Liquid AI“最重要的后期训练”。“通过创建高质量的示例，让模型学习如何分步回答复杂问题，我们还需要评估模型的聊天功能以及与用户的交互方式。”Maxime Labonne表示：“以及最令人兴奋的模型合并。在模型合并过程中，我们将同一模型的不同版本的参数合并，创建出统一的高质量模型。”

Maxime Labonne，图片来源：Liquid AI

电子商务公司Shopify的首席技术官、前微软高管、Liquid AI顾问Mikhail Parakhin（左三）表示，赢得人工智能竞赛最终将需要数百亿美元。“甚至一千亿美元。对于Liquid AI而言，目前实现这一目标是一项艰巨的任务。”Mikhail Parakhin说，“但他们拥有一项非凡的技术。”

State of Generative AI的讨论，来源：「甲子光年」拍摄

马萨诸塞州州长Maura Healey也来到现场。她说道：“Liquid AI让我想起了美国独立战争中在列克星敦和康德科（隶属大波士顿区）打响的第一枪，麻州始终致力于革命和创新。”她表示，Liquid AI为马萨诸塞州带来难得的机遇，让东海岸也能在AI行业中占据一席之地，而不至于被硅谷远抛在后。

Ramin Hasani与Maura Healey，图片：「甲子光年」拍摄

目前，Liquid AI已筹集近5000万美元，但可能还需数亿美元才能完善其AI应用。

Liquid AI起源MIT计算机科学与人工智能实验室（CSAIL）。其联合创始人之一是Daniela Rus是MIT CSAIL的主任，同时她也是Andrew和Erna Viterbi教授。与Daniela Rus一同创立Liquid AI的还有三位来自CSAIL的杰出博士后研究员。

Ramin Hasani在加入MIT前，曾是美国最大的基金管理公司之一先锋集团（Vanguard）的首席人工智能科学家；Mathias Lechner在维也纳工业大学读书时就与Hasani共同研究线虫的神经结构，这一研究对他们开发液体神经网络的工作至关重要；首席科学官Alexander Amini则是Daniela Rus的博士生。

而LFM技术源自2020年底，Ramin Hasani等发表的一篇名为《液态时间常数网络（Liquid Time-constant Networks）》的研究论文，这也让液态神经网络在数年的起伏后得到了广泛关注。但作为一个概念，液态神经网络自2018年起就存在。

Ramin Hasani等受到秀丽隐杆线虫的神经结构启发，制造出了液体神经网络。秀丽隐杆线虫是首个完整绘制神经连接图的生物。虽体型微小，却展现出高于现有人工智能系统的学习和适应能力。它拥有302个神经元，能执行复杂行为如觅食和交配。

基于这些生物特性，Daniela Rus等科学家开发了“液态时间常数网络”，一个由简单动态系统组成的连续时间模型，这些系统通过非线性门相互作用。这种模型特点是时间灵活性高，通过解微分方程生成输出，优于传统神经网络模型，特别是在处理时间序列预测方面表现卓越。

显微镜下的秀丽隐杆线虫，来源：维基百科

LFM的一个主要优势是它能够仅用很少的数字神经元就实现高效的运作，相比于其他庞大计算资源的模型，如ChatGPT，LFM在计算芯片的使用上更为高效。OpenAI最近甚至提到，下一代ChatGPT需要达到或者依赖于国家层面的技术和资金支持，其对计算力和相关基础设施的需求已经超出了常规商业运作的范畴。

（封面图来源：「甲子光年」拍摄）

END.

http://mp.weixin.qq.com/s?__biz=MzU5OTI0NTc3Mg==&mid=2247537862&idx=2&sn=f63ec0d5e1c117c83d8ee7ee5ccfe351

甲子光年

甲子光年是一家科技智库，包含智库、社群、企业服务版块，立足中国科技创新前沿阵地，动态跟踪头部科技企业发展和传统产业技术升级案例，推动人工智能、大数据、物联网、云计算、新能源、新材料、信息安全、大健康等科技创新在产业中的应用与落地。

最新文章

登上“最不可能作弊”的榜单，阶跃星辰Step-2位列中国大模型第一｜甲子光年

中国电子签，十年已过万重山｜甲子光年

全球eVTOL研发排名第9，沃飞长空如何用钉钉做研发？｜甲子光年

独家专访新型神经网络FAN作者：用傅里叶分析弥补Transformer重要缺陷｜甲子光年

美国政府COO马斯克｜甲子光年

对话李彦宏：应用驱动是百度的第一性原理，基础模型两年一个大版本就够了｜甲子光年

首批重磅嘉宾曝光！2024甲子引力年终盛典等你参与！｜甲子引力

2024，终会成为直播电商拐点｜甲子光年

AI如何在物理世界更好的产生效用？｜甲子光年

“AI+代码”是暂存的假象，还是前途无量？｜甲子光年智库

新消费时代，柔性供应链如何帮助工厂打造“新质生产力”？｜甲子光年

零一万物发布行业解决方案：AI to B如何才能不赔钱？｜甲子光年

甲小姐对话RockAI刘凡平：以群体智能挑战OpenAI的造神之路｜甲子光年

【榜单征集：2024全球AI华人青年科学领袖奖】2024甲子引力年终盛典：万千流变一如既往｜甲子引力

为什么这款只有345克重的手写AI笔记办公本出圈了？｜甲子光年

美国大选前的硅谷：政治漩涡中的权力游戏｜甲子光年

「甲子光年」在第19届亚洲品牌盛典、第十八届中国品牌节揽获四项大奖｜甲子光年

香港科技产业，不必再提“失去的二十年”｜甲子光年

独家直击Liquid AI发布会：非Transformer架构AI模型有了听觉和视觉｜甲子光年

【榜单征集：全球青年科学领袖奖】2024甲子引力年终盛典：万千流变一如既往｜甲子引力

《2024年AI代码平台及产品发展简报》——重构智能时代的开发模式，释放AI数字生产力｜甲子光年智库

年度最大港股IPO诞生，地平线做对了什么？｜甲子光年

【万千流变，一如既往】2024甲子引力年终盛典将于12月10日-11日在北京召开｜甲子引力

城市算力网，为什么是海淀？｜甲子光年

【榜单征集：企业榜】2024甲子引力年终盛典：万千流变一如既往｜甲子引力

【榜单征集：机构榜】2024甲子引力年终盛典：万千流变一如既往｜甲子引力

智源研究院：Emu3证明Scaling Law在多模态大模型上依然成立｜甲子光年

AI硬件如何摆脱“昙花一现”的魔咒｜甲子光年

AI手机爆发年，手机芯片如何从顺应潮流到引领潮流？｜甲子光年

AI触手可及，我们应该做些什么？｜甲子光年

玻色量子获数亿元A轮融资，量子计算离我们还有多远？｜甲子光年

史上录取率最低YC，一个信息检索工具为何脱颖而出？｜甲子光年

金华金义新区：因地制宜发展信创新质生产力｜甲子光年

特斯拉Robotaxi发布，马斯克望投资者再信他一次｜甲子光年

致敬稀缺：万千流变，一如既往｜甲子光年七周年

自动驾驶竞赛生死时速：中美“土洋萝卜”谁将主宰未来？｜甲子光年

人工智能学者拿下诺贝尔物理学奖，意料之外还是情理之中？｜甲子光年

处于多事之秋的OpenAI，决定拯救开发者预算｜甲子光年

从一所“年轻”大学走出的国际顶会获奖团队｜甲子光年

数据产业新实践：密态计算技术迈向商业化｜甲子光年

10个AI驱动的小产品，展现100种创新力量｜甲子光年

训练两个小时需要半个小时保存数据，如何破局？｜甲子光年

在百度这场大赛上，我们看到了“AI超级应用”的影子｜甲子光年

估值超200亿的AIoT独角兽要IPO了｜甲子光年

Meta开发者大会：黄仁勋亲测全新全息AR眼镜，Llama 3.2发布｜甲子光年

专访地瓜机器人：今天的具身智能就像八年前的自动驾驶，投入要趁早｜甲子光年

具身智能工业机器人，何必是人形？｜甲子光年

人被异化的投影，正在被机器人消除｜甲子光年

这家AI公司，做出了全球最大的原生3D大模型｜甲子光年

生成式AI落地的无数种可能，都在云栖大会看到了｜甲子光年

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

独家直击Liquid AI发布会：非Transformer架构AI模型有了听觉和视觉 ｜甲子光年

独家直击Liquid AI发布会：非Transformer架构AI模型有了听觉和视觉｜甲子光年