年终盘点之2024年AI大事件

学术 2024-12-25 11:31 山西

海归学者发起的公益学术平台

分享信息，整合资源

交流学术，偶尔风月

AI技术无疑是2024年最炙手可热的科技词汇，其内涵和外延都在随着人们越来越广泛的认可和应用变得无比丰富，复杂且充满了争议，但是毫无争议的是，这项或者叫这类新技术正在像历史上的蒸汽机、内燃机、电动机或者互联网一样缓慢但是无可阻挡的向人类社会的方方面面进行渗透。有关AI的新闻就像天气预报一样每天都在更新，知社选取了一些我们认为具有重要影响的AI大事件进行了盘点，也希望亲爱的读者提出您的看法与我们探讨。

图源：DALL-E-3

AI斩获两项诺贝尔

2024年10月8日17时45分，2024年诺贝尔物理学奖揭晓，获奖者是约翰·霍普菲尔德 (John J. Hopfield) 和杰弗里·辛顿 (Geoffrey E. Hinton)，表彰他们利用人工神经网络在机器学习方面取得的开创性发现和系列发明。这个奖项的颁发意味着主流科学界已经充分认识到了AI技术的无穷潜力，那么为这项技术进行开拓和奠基的科学家受到表彰就是顺理成章的事了。

2024物理学奖及化学奖获得者

图片来源：nobelprize.org

从本质上说，AI技术是一种仿生技术，与其他仿生产品的区别在于它模仿的对象是人类本身。诺奖颁奖词中提到：“现在，当人们谈论人工智能时，他们通常指的是使用人工神经网络的机器学习技术。这项技术最初受到了人体大脑结构的启发。在人工神经网络用具有不同值的节点来模仿大脑的神经元。这些节点以类比突触的连接方式相互影响，从而产生更强或更弱的连接。这为训练AI模型提供了最基本的理论之一。”

蛋白质的结构非常复杂

将科学界对人类大脑思维方式的理解与现代计算机技术相结合，就成为了AI技术的奠基石。而其最成功的应用之一就是Deepmind开发的蛋白质结构预测工具AlphaFold2。自1970年代以来，研究人员一直在尝试从氨基酸序列预测蛋白质结构，但这非常困难。过去半个多世纪以来，科学家一共解析了5万多个人源蛋白质的结构，这花费了几万名科学家几十年的辛勤劳动和数百亿美元的经费，而AlphaFold2在两年内给出了2亿个蛋白质的预测结果，这个效率是人类科学家的几万倍，与太多带有娱乐性质的AI工具相比，这个项目是实实在在的超级生产力工具，堪称科学界的杀手级AI应用，获得诺奖实至名归。

芯片王者英伟达成全球市值第一

强力的AI功能的实现离不开强力的AI算力支持，作为AI芯片领域毫无争议的王者，英伟达公司一直在推陈出新，不断发布的新品让各大科技巨头眼红心热，纷纷挥舞着巨额支票要求预定产品，甚至想要吞下未来几年的所有产能。新技术带来的市场垄断地位让英伟达拥有了前所未有的定价权，其主力产品的毛利率经常在90%以上甚至超过95%，即便如此也挡不住客户的抢购冲动。这也助推了英伟达公司的市值一飞冲天。从2023年4月的不到1万亿美元，到2024年6月19日，当日收盘时市值达到了3.33万亿美元，超越微软成为全球市值最高的公司。

英伟达CEO黄仁勋

得益于台积电的全力支持，英伟达的换代新品Blackwell GPU 架构和系统正在迅速出货，这款受到客户追捧的新品预示着英伟达的市场表现依然值得期待。与此相对的是，各大买家微软、OepnAI、苹果、谷歌、亚马逊和脸书等公司都在大量烧钱，芯片只是其中一部分开支，其他成本也无比庞大。但是相比于英伟达已经兑现的业绩，这些软件巨头们离赚到钱还遥遥无期。这让英伟达获得了“AI卖铲人”的称号，认为它就像淘金时代不挖金矿而服务于淘金者的那些公司，赚到的钱远比碰运气的挖矿人更稳定可靠。英伟达依靠业界最强的技术实力，已经成为了AI时代的基础性公司之一，就像上一个时代的英特尔一样。

平台巨头全面拥抱AI

虽然像ChatGpt等大语言模型确实实现了功能上的飞跃，但是还没有出现受到消费级市场认可的杀手级应用，普通消费者更多的把AI当作新型科技玩具而非不可或缺的工具，无论是生产还是娱乐。为了能够出现“杀手级”应用让巨额投入能够产生回报，微软和苹果两家居于生态位中心的科技巨头全面引入了AI技术来重构其产品线。微软将其生成式AI技术（如GPT-4/5）深度整合到Office套件（Word、Excel、PowerPoint等），推出了名为“Copilot”的智能助手，功能包括自动撰写文档、生成分析报告、创建演示文稿等，显著提升办公效率；微软的Bing搜索和Edge浏览器整合了生成式AI，使搜索结果更精准，并支持实时生成文章总结、内容提炼等功能。而苹果公司将AI技术融入其硬件生态，如iPhone、iPad、Apple Watch等设备，主要表现在Siri的升级，通过生成式AI提供更流畅、更智能的语音交互功能；同时升级设备端AI，通过先进的神经引擎（Neural Engine）实现实时的语音处理、图像识别和个性化建议。

不光是软件，全面定制化的AI PC也成为了押注的方向：Apple Intelligence 将在所有搭载Apple M 系列处理器的 Mac 上推出，而 Copilot+ 功能仅在越来越多片上系统内配备神经处理单元 (NPU) 的 PC 上提供。研究公司 IDC 预测，到 2027 年，人工智能 PC 将占全球 PC 出货量的60%。尽管人工智能 PC 在 2024 年成为热门词，但尚未吸引太多用户。

网络巨头思科将 AI 作为 2024 年的首要任务之一，斥资 280 亿美元收购了 Splunk，旨在打造一个专为人工智能时代打造的完整安全运营中心。还与 Nvidia 合作推出了一系列新的 AI 基础设施，即 Nexus HyperFabric AI Cluster。亚马逊云计算公司 AWS则向人工智能初创公司 Anthropic 追加投资了40亿美元，后者在新型生成式模型和定制AI芯片领域都很有希望。

多模态大模型的崛起：

OpenAI 推出ChatGPT-4o

ChatGPT-4o中的 "o" 代表 "omni"（全能），标志着 OpenAI 在人工智能技术上的又一次重大飞跃。其关键特点在于多模态处理能力。ChatGPT-4o 能够实时处理和生成文本、音频以及图像等多种模态的数据，提供更全面的解决方案。另一方面，通过多模态学习，AI模型可以将一个模态学到的知识迁移到另一个模态上，从而提高模型的泛化能力。

ChatGPT-4o发布会现场

图片来源：chatgpt

而在多模态数据的基础之上，ChatGPT-4o提供了更为自然的人机交互体验，在GPT-4o之前，用户使用语音模式与ChatGPT对话时，GPT-3.5的平均延迟为2.8秒，GPT-4为5.4秒，音频在输入时还会由于处理方式丢失大量信息，让GPT-4无法直接观察音调、说话的人和背景噪音，也无法输出笑声、歌唱声和表达情感。但GPT-4o可以在232毫秒内对音频输入做出反应，与人类在对话中的反应时间相近。在发布会上，OpenAI的两位高管做出了演示：GPT-4o能够因测试人员急促的喘气声中听出“紧张”，并且建议他进行深呼吸。此外，GPT-4o还可以根据用户要求变换语调。这一交流体验的提升意义非凡，可以说人们对于通用AI又迈进了可观的一步。

陶哲轩宣布等式理论计划基本成功

2024年9月25日，数学家陶哲轩启动了一项雄心勃勃的项目——等式理论计划。该计划旨在探索按蕴含关系排序的原群等式理论空间，经过57天的紧张合作，成功完成了4694个等式之间22028942个蕴含关系的分析。根据 GitHub 显示，等式理论计划项目有 45 位贡献者。而在计划过程中，陶哲轩使用 GitHub Copilot 来处理日常任务，加快代码编写，Claude 则被用来协助创建可视化工具，而 ChatGPT 更多时候在扮演一个激发数学家们灵感的小助手角色。不过陶哲轩也表示，大模型们在项目中的表现“低于预期”，数学家们更多的时候用到的还是“经典AI”

陶哲轩

图片来源：The White House

无论如何，这次项目的成功为人们展示了一幅惊人的未来愿景──人类直觉和机器学习能力在纯粹思维领域的有机结合，足以解决这些领域中的一些最具挑战的问题。这一成就不仅标志着等式理论领域的重要突破，也为未来AI数学工具的基准测试提供了参考。

AI巨头的垄断：

OpenAI与伊隆·马斯克的诉讼纠纷

自2024年3月起，马斯克多次对OpenAI 及其首席执行官塞缪尔·奥特曼 (Samuel Altman) 提起诉讼，指控其违反了OpenAI成立时签订的捐赠条款，转而追求商业利益，尤其是让公司服务于微软的商业目的。起诉书称，OpenAI “在推动人工智能发展的过程中将利润置于公共利益之上”。

马斯克今年已对OpenAI发起了一系列法律行动

图片来源：Allison Robbert – Pool via CNP/Zuma Press

马斯克是OpenAI的初始投资人之一。2015年，马斯克为OpenAI投资了近5000万美元。但2019年，OpenAI逐渐从从非营利组织转型为“有限盈利”组织，成立了营利性子公司的管理实体。在这一过程中，马斯克多次指出OpenAI背离使命，并在2018年正式宣布退出OpenAI董事会。但今年3月，OpenAI公开了一组邮件截图，这些邮件资料显示，马斯克曾对OpenAI创建营利性实体的决定表示认同。OpenAI声称，马斯克希望获得营利性实体的多数股权、初始董事会控制权并担任首席执行官。而OpenAI对此拒绝接受。

截至11月末，马斯克已经三次加码诉讼力度，指控OpenAI和微软涉嫌不正当竞争行为，违反了美国的反垄断法律。

人工智能将获得版权豁免政策，

引发英国抗议浪潮

2024年12月，英国推出提案，拟设定版权法的豁免政策，根据这种“版权豁免政策”，科技公司将被允许自由使用受版权保护的材料来训练人工智能模型，除非作者和版权公司特别声明了不允许AI使用其内容。此提案一出，激起了英国出版界和创作者群体的激烈反弹。政府方面表示，该提案是为了给人工智能开发提供一个获取训练材料的透明化渠道。

出版商协会首席执行官丹·康威对此提出反对，他说：“目前还没有任何客观案例支持设立新的版权豁免政策。重要的是，确保包括出版商在内的内容生态系统获得适当的商业激励来投资高价值内容，并确保版权持有者能够保留对作品使用方式和时间的基本控制权”。

随后，一个由英国作家、出版商、音乐家、摄影师、电影制片人和报刊从业者组成的抗议组织提出了一份联合声明，专门驳斥版权豁免的提议。披头士前成员保罗·麦卡特尼和歌手凯特·布什成为抗议组织中的主力军，他们与演员朱丽安·摩尔、斯蒂芬·弗莱和休·博内威利一起签署了一份请愿书，目前已有得到37500 余人的支持。该请愿书称，“未经许可使用创意作品来训练生成式人工智能，是对创作者生计的严重威胁。这绝不能被允许”。

保罗·麦卡特尼

图片来源：Raphael Pour-Hashemi

通用人工智能的先声：

特斯拉人形机器人‘擎天柱’明年上线

2024年7月，特斯拉首席执行官埃隆·马斯克声称，特斯拉生产的人形机器人“擎天柱”（Optimus ）将在2025年上线。据悉，擎天柱是一个协助汽车生产的人形机器人。它身高约 1.7米，体重56公斤，可以帮助完成汽车制造过程中的“枯燥、重复和危险”工作。

马斯克于 2022 年展示了人形机器人擎天柱的原型机

图片来源：Photograph: Tesla/AFP/Getty Images

通用人工智能（AGI）是许多人工智能研究人员梦寐以求的、足以与人类相当的人工智能。专家认为，机器人技术对于实现AGI至关重要。只有人工智能具有物理形态，它才能真正理解我们的世界。

马斯克曾表示，他的目标是实现机器人的大规模生产，并且将每个机器人的成本控制在20000 美元以内。他还在社交媒体宣布称，特斯拉将在2026年制造出可以出售给其他公司的人形机器人。

特斯拉的擎天柱正在折叠衬衫

图片来源：@elonmusk/X

对此您怎么看呢？对于2024年的AI发展，您认为的最值得关注的事件有哪些呢？不妨留言与大家分享。

点击下方知社人才广场，查看最新学术招聘

扩展阅读

信AI，得永生！瑞士教堂推出AI耶稣

AI都得诺奖了，常年重复劳动的我们还保得住饭碗吗？

中国科学院发布八条科研提醒：诚信用AI

媒体转载联系授权请看下方

知社学术圈

海归学者发起的公益学术交流平台，旨在分享学术信息，整合学术资源，加强学术交流，促进学术进步

最新文章

年终盘点之2024年AI大事件

可见高透明、红外宽波段调制的热致变色智能窗 | NSR

港科大Sci. Adv.: TEA打印技术有望将压电生物材料推向未来生物医学和生物电子学

Npj Comput. Mater.: 高性能轻质难熔高熵合金新突破：数据驱动、逐层多目标设计

世界第一个商业级核聚变电厂即将开工 ; 地磁北极正式宣布新位置 | 学界速递

告别复杂体系的实验试错法：离子热电中的机器学习 | NSR

减肥大利空: 脂肪细胞总记得“曾经圆过”; 一万年前的北美原住民是最凶猛的猎杀者 | 科技趣评

30周年限定一场真诚的答谢宴！

“考生指定阅卷人”催生同行评审身份盗用？; 喜马拉雅山脉积雪大量融化增加洪水风险 | 学界速递

湿度不敏感、强韧离子凝胶及其在膝关节压力监测上的应用 | NSR

PNAS: “压力陈化” 策略：解锁高压材料研究潜力

Npj Comput. Mater.: 复杂功能材料的高效设计：量子启发算法+机器学习

实现室温超导，总共分几步？

单神经元深度学习“小模型”及其时间序列预测应用 | NSR

吉大Nat. Commun.: 硫系III₂–VI₃二维材料的电荷密度波探索

Npj Comput. Mater.: 如何加速发现新型钴基高温合金？正是你想到的AI！

美著名机构推行“扶弱”资助, 一因素否决多数名校 ; 学术期刊作者垄断严重, 尖端设备是主因？| 学界速递

氢化物超导体A15-La4H23中发现反常金属态

2024中国十大新锐科技人物评选结果揭晓！

官宣! 中美续签两国政府科学技术合作协定

看一眼少一眼！这十大宝藏石窟，不该被错过

Sci. Adv.: 橡胶生物光电子刺激器

NSR综述：多模态大语言模型

关于“痒痒”的前世今生

Npj Comput. Mater.: 存储器的电写磁读：有赖二维磁电耦合异质结构？

史上最大规模掠食事件：毛鳞鱼的黎明决战

光模块控温微器件用高强高效热电材料 | NSR

印度“带量采购”1.3万种学术期刊, 过半高校师生可免费阅读 ; 中国知网将制定完善数据库价格管理办法 | 学界速递

Npj Comput. Mater.: 局部原子邻域描述符—非数据驱动无损压缩

南洋理工Sci. Adv.: 基于键重构的颗粒力学超材料

NSR专题 | 功能与智能纤维（特邀编辑：朱美芳）

今日Sci. Adv.: 磁性剪纸动态变化“魔毯”

湘潭大学智能材料多场耦合与器件团队诚聘英才

标题党的底层逻辑: 引发愤怒最易带来转发 ; 特朗普提名亿万富翁兼私人宇航员执掌NASA | 学界速递

上海科技大学刘健鹏课题组招募启事

今日Sci. Adv.: 仿魔鬼鱼穿越障碍软机器鱼

Npj Comput. Mater.: 周益春教授团队突破HfO2基铁电薄膜辐照位移损伤的分子动力学模拟

若读博不是双向奔赴而是相互耽误，PI该如何委婉“劝退”博士生？

电催化微环境调控的近期研究进展 | NSR综述

南科大Nano Letters：二维铁电晶体管的载流子调控研究新进展

Npj Comput. Mater.: 揭秘纳米世界：四维STEM与AI的先进成像技术

天眼FAST发现的脉冲星数量突破1000颗 ; 终于明白为何三花和玳瑁大都是母猫了 | 学界速递

NSR综述 | 纳米药物赋能器官损伤修复

表面风情录 ― 阻塞绝缘体 | Ising专栏

著名杂志《科学美国人》主编因争议言论辞职; 科学家们正在新社媒Bluesky上扎堆 | 科技趣评

谁在争夺世界经济的“铁王座”？

考研人数连年降低的背后：读研还是一项高收益的投资吗？

【专刊】JMAT超材料研究进展专刊上线啦！

PNAS：力学褶皱在非极性薄膜中构建周期性挠曲电极化结构

Npj Comput. Mater.: 数据驱动寻找：化学逆向合成路径

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉