年终盘点之2024年AI大事件

学术   2024-12-25 11:31   山西  

海归学者发起的公益学术平台

分享信息,整合资源

交流学术,偶尔风月

AI技术无疑是2024年最炙手可热的科技词汇,其内涵和外延都在随着人们越来越广泛的认可和应用变得无比丰富,复杂且充满了争议,但是毫无争议的是,这项或者叫这类新技术正在像历史上的蒸汽机、内燃机、电动机或者互联网一样缓慢但是无可阻挡的向人类社会的方方面面进行渗透。有关AI的新闻就像天气预报一样每天都在更新,知社选取了一些我们认为具有重要影响的AI大事件进行了盘点,也希望亲爱的读者提出您的看法与我们探讨。


图源:DALL-E-3


1


AI斩获两项诺贝尔


2024年10月8日17时45分,2024年诺贝尔物理学奖揭晓,获奖者是约翰·霍普菲尔德 (John J. Hopfield) 和杰弗里·辛顿 (Geoffrey E. Hinton),表彰他们利用人工神经网络在机器学习方面取得的开创性发现和系列发明。这个奖项的颁发意味着主流科学界已经充分认识到了AI技术的无穷潜力,那么为这项技术进行开拓和奠基的科学家受到表彰就是顺理成章的事了。

2024物理学奖及化学奖获得者
图片来源:nobelprize.org

从本质上说,AI技术是一种仿生技术,与其他仿生产品的区别在于它模仿的对象是人类本身。诺奖颁奖词中提到:“现在,当人们谈论人工智能时,他们通常指的是使用人工神经网络的机器学习技术。这项技术最初受到了人体大脑结构的启发。在人工神经网络用具有不同值的节点来模仿大脑的神经元。这些节点以类比突触的连接方式相互影响,从而产生更强或更弱的连接。这为训练AI模型提供了最基本的理论之一。”

蛋白质的结构非常复杂

将科学界对人类大脑思维方式的理解与现代计算机技术相结合,就成为了AI技术的奠基石。而其最成功的应用之一就是Deepmind开发的蛋白质结构预测工具AlphaFold2。自1970年代以来,研究人员一直在尝试从氨基酸序列预测蛋白质结构,但这非常困难。过去半个多世纪以来,科学家一共解析了5万多个人源蛋白质的结构,这花费了几万名科学家几十年的辛勤劳动和数百亿美元的经费,而AlphaFold2在两年内给出了2亿个蛋白质的预测结果,这个效率是人类科学家的几万倍,与太多带有娱乐性质的AI工具相比,这个项目是实实在在的超级生产力工具,堪称科学界的杀手级AI应用,获得诺奖实至名归。



2


 芯片王者英伟达成全球市值第一


强力的AI功能的实现离不开强力的AI算力支持,作为AI芯片领域毫无争议的王者,英伟达公司一直在推陈出新,不断发布的新品让各大科技巨头眼红心热,纷纷挥舞着巨额支票要求预定产品,甚至想要吞下未来几年的所有产能。新技术带来的市场垄断地位让英伟达拥有了前所未有的定价权,其主力产品的毛利率经常在90%以上甚至超过95%,即便如此也挡不住客户的抢购冲动。这也助推了英伟达公司的市值一飞冲天。从2023年4月的不到1万亿美元,到2024年6月19日,当日收盘时市值达到了3.33万亿美元,超越微软成为全球市值最高的公司。

英伟达CEO黄仁勋

得益于台积电的全力支持,英伟达的换代新品Blackwell GPU 架构和系统正在迅速出货,这款受到客户追捧的新品预示着英伟达的市场表现依然值得期待。与此相对的是,各大买家微软、OepnAI、苹果、谷歌、亚马逊和脸书等公司都在大量烧钱,芯片只是其中一部分开支,其他成本也无比庞大。但是相比于英伟达已经兑现的业绩,这些软件巨头们离赚到钱还遥遥无期。这让英伟达获得了“AI卖铲人”的称号,认为它就像淘金时代不挖金矿而服务于淘金者的那些公司,赚到的钱远比碰运气的挖矿人更稳定可靠。英伟达依靠业界最强的技术实力,已经成为了AI时代的基础性公司之一,就像上一个时代的英特尔一样。




3


平台巨头全面拥抱AI


虽然像ChatGpt等大语言模型确实实现了功能上的飞跃,但是还没有出现受到消费级市场认可的杀手级应用,普通消费者更多的把AI当作新型科技玩具而非不可或缺的工具,无论是生产还是娱乐。为了能够出现“杀手级”应用让巨额投入能够产生回报,微软和苹果两家居于生态位中心的科技巨头全面引入了AI技术来重构其产品线。微软将其生成式AI技术(如GPT-4/5)深度整合到Office套件(Word、Excel、PowerPoint等),推出了名为“Copilot”的智能助手,功能包括自动撰写文档、生成分析报告、创建演示文稿等,显著提升办公效率;微软的Bing搜索和Edge浏览器整合了生成式AI,使搜索结果更精准,并支持实时生成文章总结、内容提炼等功能。而苹果公司将AI技术融入其硬件生态,如iPhone、iPad、Apple Watch等设备,主要表现在Siri的升级,通过生成式AI提供更流畅、更智能的语音交互功能;同时升级设备端AI,通过先进的神经引擎(Neural Engine)实现实时的语音处理、图像识别和个性化建议。


不光是软件,全面定制化的AI PC也成为了押注的方向:Apple Intelligence 将在所有搭载Apple M 系列处理器的 Mac 上推出,而 Copilot+ 功能仅在越来越多片上系统内配备神经处理单元 (NPU) 的 PC 上提供。研究公司 IDC 预测,到 2027 年,人工智能 PC 将占全球 PC 出货量的60%。尽管人工智能 PC 在 2024 年成为热门词,但尚未吸引太多用户。

网络巨头思科将 AI 作为 2024 年的首要任务之一,斥资 280 亿美元收购了 Splunk,旨在打造一个专为人工智能时代打造的完整安全运营中心。还与 Nvidia 合作推出了一系列新的 AI 基础设施,即 Nexus HyperFabric AI Cluster。亚马逊云计算公司 AWS则向人工智能初创公司 Anthropic 追加投资了40亿美元,后者在新型生成式模型和定制AI芯片领域都很有希望。



4


多模态大模型的崛起:

OpenAI 推出ChatGPT-4o


ChatGPT-4o中的 "o" 代表 "omni"(全能),标志着 OpenAI 在人工智能技术上的又一次重大飞跃。其关键特点在于多模态处理能力。ChatGPT-4o 能够实时处理和生成文本、音频以及图像等多种模态的数据,提供更全面的解决方案。另一方面,通过多模态学习,AI模型可以将一个模态学到的知识迁移到另一个模态上,从而提高模型的泛化能力。

ChatGPT-4o发布会现场
图片来源:chatgpt

而在多模态数据的基础之上,ChatGPT-4o提供了更为自然的人机交互体验,在GPT-4o之前,用户使用语音模式与ChatGPT对话时,GPT-3.5的平均延迟为2.8秒,GPT-4为5.4秒,音频在输入时还会由于处理方式丢失大量信息,让GPT-4无法直接观察音调、说话的人和背景噪音,也无法输出笑声、歌唱声和表达情感。但GPT-4o可以在232毫秒内对音频输入做出反应,与人类在对话中的反应时间相近。在发布会上,OpenAI的两位高管做出了演示:GPT-4o能够因测试人员急促的喘气声中听出“紧张”,并且建议他进行深呼吸。此外,GPT-4o还可以根据用户要求变换语调。这一交流体验的提升意义非凡,可以说人们对于通用AI又迈进了可观的一步。



5


陶哲轩宣布等式理论计划基本成功


2024年9月25日,数学家陶哲轩启动了一项雄心勃勃的项目——等式理论计划。该计划旨在探索按蕴含关系排序的原群等式理论空间,经过57天的紧张合作,成功完成了4694个等式之间22028942个蕴含关系的分析。根据 GitHub 显示,等式理论计划项目有 45 位贡献者。而在计划过程中,陶哲轩使用 GitHub Copilot 来处理日常任务,加快代码编写,Claude 则被用来协助创建可视化工具,而 ChatGPT 更多时候在扮演一个激发数学家们灵感的小助手角色。不过陶哲轩也表示,大模型们在项目中的表现“低于预期”,数学家们更多的时候用到的还是“经典AI”

陶哲轩
图片来源:The White House

无论如何,这次项目的成功为人们展示了一幅惊人的未来愿景──人类直觉和机器学习能力在纯粹思维领域的有机结合,足以解决这些领域中的一些最具挑战的问题。这一成就不仅标志着等式理论领域的重要突破,也为未来AI数学工具的基准测试提供了参考。



6


 AI巨头的垄断:

OpenAI与伊隆·马斯克的诉讼纠纷


自2024年3月起,马斯克多次对OpenAI 及其首席执行官塞缪尔·奥特曼 (Samuel Altman) 提起诉讼,指控其违反了OpenAI成立时签订的捐赠条款,转而追求商业利益,尤其是让公司服务于微软的商业目的。起诉书称,OpenAI “在推动人工智能发展的过程中将利润置于公共利益之上”。

马斯克今年已对OpenAI发起了一系列法律行动
图片来源:Allison Robbert – Pool via CNP/Zuma Press

马斯克是OpenAI的初始投资人之一。2015年,马斯克为OpenAI投资了近5000万美元。但2019年,OpenAI逐渐从从非营利组织转型为“有限盈利”组织,成立了营利性子公司的管理实体。在这一过程中,马斯克多次指出OpenAI背离使命,并在2018年正式宣布退出OpenAI董事会。但今年3月,OpenAI公开了一组邮件截图,这些邮件资料显示,马斯克曾对OpenAI创建营利性实体的决定表示认同。OpenAI声称,马斯克希望获得营利性实体的多数股权、初始董事会控制权并担任首席执行官。而OpenAI对此拒绝接受。

截至11月末,马斯克已经三次加码诉讼力度,指控OpenAI和微软涉嫌不正当竞争行为,违反了美国的反垄断法律。



7


人工智能将获得版权豁免政策,

引发英国抗议浪潮


2024年12月,英国推出提案,拟设定版权法的豁免政策,根据这种“版权豁免政策”,科技公司将被允许自由使用受版权保护的材料来训练人工智能模型,除非作者和版权公司特别声明了不允许AI使用其内容。此提案一出,激起了英国出版界和创作者群体的激烈反弹。政府方面表示,该提案是为了给人工智能开发提供一个获取训练材料的透明化渠道。

出版商协会首席执行官丹·康威对此提出反对,他说:“目前还没有任何客观案例支持设立新的版权豁免政策。重要的是,确保包括出版商在内的内容生态系统获得适当的商业激励来投资高价值内容,并确保版权持有者能够保留对作品使用方式和时间的基本控制权”。

随后,一个由英国作家、出版商、音乐家、摄影师、电影制片人和报刊从业者组成的抗议组织提出了一份联合声明,专门驳斥版权豁免的提议。披头士前成员保罗·麦卡特尼和歌手凯特·布什成为抗议组织中的主力军,他们与演员朱丽安·摩尔、斯蒂芬·弗莱和休·博内威利一起签署了一份请愿书,目前已有得到37500 余人的支持。该请愿书称,“未经许可使用创意作品来训练生成式人工智能,是对创作者生计的严重威胁。这绝不能被允许”。

保罗·麦卡特尼
图片来源:Raphael Pour-Hashemi



8


通用人工智能的先声:

特斯拉人形机器人‘擎天柱’明年上线


2024年7月,特斯拉首席执行官埃隆·马斯克声称,特斯拉生产的人形机器人“擎天柱”(Optimus )将在2025年上线。据悉,擎天柱是一个协助汽车生产的人形机器人。它身高约 1.7米,体重56公斤,可以帮助完成汽车制造过程中的“枯燥、重复和危险”工作。

马斯克于 2022 年展示了人形机器人擎天柱的原型机
图片来源:Photograph: Tesla/AFP/Getty Images

通用人工智能(AGI)是许多人工智能研究人员梦寐以求的、足以与人类相当的人工智能。专家认为,机器人技术对于实现AGI至关重要。只有人工智能具有物理形态,它才能真正理解我们的世界。

马斯克曾表示,他的目标是实现机器人的大规模生产,并且将每个机器人的成本控制在20000 美元以内。他还在社交媒体宣布称,特斯拉将在2026年制造出可以出售给其他公司的人形机器人。

特斯拉的擎天柱正在折叠衬衫
图片来源:@elonmusk/X


对此您怎么看呢?对于2024年的AI发展,您认为的最值得关注的事件有哪些呢?不妨留言与大家分享。

点击下方知社人才广场,查看最新学术招聘


扩展阅读

 

信AI,得永生!瑞士教堂推出AI耶稣
AI都得诺奖了,常年重复劳动的我们还保得住饭碗吗?
中国科学院发布八条科研提醒:诚信用AI
媒体转载联系授权请看下方

知社学术圈
海归学者发起的公益学术交流平台,旨在分享学术信息,整合学术资源,加强学术交流,促进学术进步
 最新文章