首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

2024年人工智能发展报告总结 | IDCF

科技 2024-11-05 07:58 天津

点这里👇星标关注，获取最新资讯！

作者：道上来源：AI道上

斯坦福大学教授李飞飞团队关于2024年人工智能发展报告总结。

IDCF

一、核心信息

在2024年，人工智能（AI）领域取得了显著的进展，但也面临着挑战。

AI在特定任务上超越了人类，如图像分类和语言理解，但在更复杂的任务上仍有局限。

工业界在AI研究中发挥了主导作用，尤其在机器学习模型的产出上。

训练大型AI模型的成本不断上升，例如GPT-4花了约7800万美金的，Gimini花了约1.91亿美金。

美国、中国和欧洲是AI模型的主要贡献者，其中中国在AI专利方面领先。

AI模型的可靠性评估缺乏统一标准，生成式AI投资激增，AI提高了工作者的效率和质量，加速了科学和医疗的发展，美国AI相关条款发布数量急剧增加，全球对AI潜在影响的意识增强，紧张情绪上升。

IDCF

二、AI研究和发展

2.1 核心要点

AI研究继续由工业界主导，公开源码的模型数量增加，训练成本上升，美国、中国和欧洲在AI大模型发展上占主导地位。中国在AI专利方面占据领先地位，GitHub上的AI研究资源和相关论文发表数量持续增长。

2.2 核心对比信息

从2010年到2022年，AI相关的论文发表数量逐年增加，美国在发布优秀的机器学习模型数量上保持世界首位。

2.3 模型是否会用尽数据

AI模型的发展依赖于大量数据，但有担忧表示，计算机科学家可能很快就会用尽高质量数据。尽管合成数据可以缓解这一问题，但使用合成数据训练的模型可能会出现性能下降。

2.4 基础模型发展

基础模型在广泛的数据集上训练，具有多功能性，并适用于许多下游应用。这些模型在实际场景中的部署越来越多，不同国家和组织在基础模型的发布数量上有所不同。

2.5 训练模型成本

训练大型AI模型的成本不断上升，达到数千万美元甚至数亿美元。这表明了AI领域在资源投入方面的增长。

IDCF

三、技术性能

3.1 核心要点

AI在特定任务上超越了人类，多模态AI模型的出现，如Google的Gemini和OpenAI的GPT-4，展示了处理图像和文本信息的能力。新的benchmarks评估集的出现，如SWE-bench和HEIM，以及人类评估的引入，如聊天机器人竞技场排行榜，反映了AI技术性能的提升。

3.2 重要模型发布情况

2023年见证了多个重要AI模型的发布，包括Anthropic的Claude、OpenAI的GPT-4、Stability AI的Stable Diffusion v2等，这些模型在多项benchmarks中超越了人类水平。

3.3 AI表现情况

AI在图像分类、英语理解和自然语言推理等任务中超越了人类，但在竞赛数学、多语言理解和视觉常识推理等任务上仍有局限。

3.4 多学科、高难度评估集 (MMMU & GPQA & ARC)

新的评估集如MMMU、GPQA和ARC的出现，旨在评估AI的多学科推理能力和抽象归纳能力。尽管AI模型在这些评估中取得了一定的成绩，但与人类专家相比仍有差距。

3.5 Agents

基于大型语言模型的AI代理在特定场景中自动处理任务的能力得到了提升，如AgentBench评估的基于LLM的25个agents。

3.6 RLHF & RLAIF

RLHF和RLAIF是两种基于强化学习的方法，用于训练AI模型以更好地符合人类的偏好和反馈。RLAIF在生成无害对话任务中表现优于RLHF。

3.7 LLM随着时间迭代效果对比

随着时间的推移，LLM的效果有所变化。一些研究表明，随着新数据和用户反馈的加入，某些任务的效果可能出现下降。

3.8 提升LLM效果的技巧

包括prompting、OPRO和fine-tuning在内的多种技术被用来提升LLM的效果。这些技术通过不同的方法优化模型性能，如通过自然语言描述任务或减少内存需求。

3.9 训练AI系统对环境的影响

训练大型AI模型消耗大量资源并释放二氧化碳，对环境造成影响。尽管如此，AI系统也可以用于预测城市空气质量和优化能源使用，从而对环境产生积极影响。

IDCF

四、AI可靠性

AI的可靠性评估涉及隐私、数据治理、透明性和可解释性、安全性和公平性等多个方面。目前，对LLM的全面标准评估存在缺陷，政治伪造内容的产生和检测成为一个问题，ChatGPT在政治上的偏见也引起了关注。

4.1 AI可靠性定义

AI的可靠性从数据治理、可解释性、公平性、隐私、安全性和透明性等多个维度进行定义和评估。

IDCF

五、AI对经济的影响

AI对经济的影响是多方面的，包括提高生产效率、改变工作市场和投资趋势。生成式AI的投资增长迅速，AI相关工作职位数量减少，但AI降低了企业支出并提升了收益。中国在工业机器人领域占据主导地位，AI提高了工作者的产能和效率。《财富》500强公司越来越多地讨论人工智能，特别是生成式AI。

5.1 AI重大新闻

2023年，AI领域发生了多项重大新闻，包括BioNTech收购AI公司InstaDeep、微软对OpenAI的投资、GitHub Copilot的发布、Einstein GPT和微软Office的融合、Bloomberg使用LLM进行金融数据分析等。

5.2 工作信息

AI相关工作在工作市场占比有所变化，美国AI工作技能的需求有所下降，但香港对AI人才的需求相对较高。全球新兴成立的AI公司数量持续增加。

5.3 开发者对AI工具使用情况

开发者对AI工具的使用情况显示，GitHub Copilot和ChatGPT的使用量最高，云服务平台的使用也相当普遍。

IDCF

六、AI在医疗与教育的进展

AI在医疗和教育领域的应用取得了显著进展。AI加快了科技进步，如AlphaDev和GNoME的应用。在医疗领域，AI系统如EVEscape和AlphaMissence的发布提高了疾病预测和基因分类的效率。FDA批准的AI相关医疗设备数量增加，国际上人工智能相关的学位课程也在迅速增加。

IDCF

七、公众对AI的观点

公众对AI的潜在影响越来越关注，紧张情绪上升。西方国家对AI的情绪虽然低迷，但正在逐渐改善。公众对AI的经济影响持悲观态度，但ChatGPT已经被广泛认知和使用。不同国家对ChatGPT的态度普遍积极，GPT-4在大模型发布后吸引了大量公众注意力。

END

《研发效能(DevOps)工程师》工信部教考中心-职业技术证书

🏆 考取证书，提升职业竞争力！

报名咨询：黛西老师159 1031 7788

1门顶5门，学习端到端的研发生命周期！

稳稳拿捏400+技术技能知识点。

http://mp.weixin.qq.com/s?__biz=MzA5NzU3Njc5Mw==&mid=2651261285&idx=1&sn=ef22fa3754c925c22e5de41071eeb3ce

分享研发效能（DevOps）相关趋势、发展、技术、实践等优质内容和组织相关活动。 IDCF国际DevOps教练联合会，培养端到端研发效能人才，链接高效能组织与个人，成就不凡。

最新文章

从4年缩短至4个月的速成超算中心！美国政府效率部马部长变身AI基建狂魔，意味着什么？| IDCF

SDL最佳实践原则丨IDCF

软件开发模式变迁史——从瀑布到敏捷再到DevOps | IDCF

《工程效能十日谈》读书创造营招募 | IDCF

工程师文化：比亚迪的底色 | IDCF

产品KPI：产品经理24个绩效指标及计算公式详解 | IDCF

复盘华为的国际化之路：青山处处埋忠骨，世界何处不是家 | IDCF

架构师必备10大接口性能优化秘技，条条经典！ | IDCF

30岁以上的项目经理，少奋斗20年的职业规划路线图及应对策略

破局与重塑：一家头部券商的研发精益效能之路 | IDCF

顶层设计：小红书取消专业职级的4个错误 | IDCF

技术专家面试的底层逻辑解析 | IDCF

制造业最前沿7大模式：智能制造、网络化制造、云制造、增材制造、绿色制造、服务型制造、协同制造思维导图详解

ChatGPT之父山姆·奥特曼分享的13个成功诀窍 | IDCF

从运营思维来思考产品和运营的关系 | IDCF

任正非最新谈话：绝大多数的企业并没有受到美国的制裁，开放创新，充分利用别人的先进成果，才是一个企业真实的出路……

流程与管理—三大复盘的方法（AAR/GRAI/KPT) | IDCF

项目管理说穿了，就是六抓六放 | IDCF

项目管理说穿了，就是六抓六放 | IDCF

2024年人工智能发展报告总结 | IDCF

软件架构技术-云原生架构与CICD/DevOps | IDCF

后台工程师职业能力提升之道 | IDCF

如何提高决断力？ | IDCF

最佳实践：基于BDD的可执行需求与自动化验证研究 | IDCF

最佳实践：DevOps 开发推广实践探索——由点及面，实践出真知丨IDCF

论文解读：迄今为止最好的 RAG 技术栈

鹅厂写码13年，我总结的程序员高效阅读方法论丨IDCF

TechLead 如何构建团队愿景?丨IDCF

倒计时3天！珠海开发者大会暨“1024”程序员嘉年华活动欢迎您的参加！

最佳实践：独立测试团队敏捷实践探索 | IDCF

最佳实践：如何构建研发效能指标度量体系丨IDCF

DevOps如何构建数字化项目管理?诚邀参加中国项目经理大会

邀请函：2024珠海开发者大会暨“1024”程序员节嘉年华活动

最佳实践：研发效能度量应用治理实践丨IDCF

最佳实践：容器技术为研发效能带来革命性变革丨IDCF

制造业项目经理必备：从项目启动到交付的全方位攻略 | IDCF

一文看懂什么是企业数字化 | IDCF

程序员必备！面向Prompt编程全攻略 | IDCF

重磅：信通院&IDCF联合征集 - 中国软件工程智能化系列标准 | IDCF

研发效能（DevOps）工程师如何引领技术创新浪潮？| IDCF

44页PPT | 华为战略规划核心：全面解读‘五看三定’方法论及其在战略洞察与制定中的应用

如何进行产品设计？比画原型更重要的是掌握这三种架构图| IDCF

LLM RAG面试问题大全! | IDCF

项目跟进难？7大步骤轻松跟进项目全过程 | IDCF

Sam Altman罕见发长文：ASI终将至，准备好迎接“智能时代”吧！深度学习是有效路径

测试分层策略实践模型 | IDCF

职业技术证书《研发效能(DevOps)工程师（中级）》第十三期·开启报名丨IDCF

《解决企业个性化代码生成准确率的核心实践》—徐磊老师议题预告，10.19 · 上海站

架构师基本功：如何画好一张UML用例图？ | IDCF

DevOps的十个实践和三步工作法 | IDCF

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉