2024年AI大模型发展趋势综述

文摘 2025-01-07 17:48 新加坡

2024年已经过去, 我的总结在此 2024, 我借AI之力, 打造了上线首月用户破万的产品

这篇文章里, 我们总结一下大模型有什么发展:

技术突破：GPT-4不再是高峰

2024年最显著的变化是，GPT-4不再是遥不可及的技术高峰。目前已有18家机构的模型性能超越了2023年3月发布的原始GPT-4，包括谷歌、OpenAI、阿里巴巴、Anthropic、Meta等科技巨头，也包括一些新兴的AI公司。在权威的Chatbot Arena排行榜上，原始GPT-4已经跌至70名开外。

大模型变得更"轻"更快

过去一年，大模型在效率方面取得了惊人进展。一些GPT-4级别的模型已经可以在高配笔记本电脑上运行，这在一年前是不可想象的。同时，各大模型提供商的API价格也大幅下降，有些降幅达到了12倍以上。这意味着使用AI大模型的成本和能耗都在显著降低。

上下文长度的突破

相比2023年大多数模型仅支持4K-8K token的限制，2024年的模型实现了革命性突破。目前每个主要提供商都有支持10万以上token的模型，Google的Gemini系列更是达到了200万token。这极大扩展了模型的应用场景，让整本书籍的分析、大规模代码审查等任务成为可能。

多模态能力成为标配

2024年，几乎所有主要的模型都具备了多模态能力。除了处理文本，它们现在可以理解图像、音频，有些甚至能处理视频。更令人兴奋的是实时语音对话和实时视频分析功能的出现，让AI交互变得更自然。

"推理型"模型的崛起

2024年末期出现了一种新型模型架构，以OpenAI的o1系列为代表。这类模型通过在推理阶段投入更多计算资源，来提升解决复杂问题的能力。虽然计算成本较高，但开创了提升模型能力的新方向。

提示词工程的商业化

基于提示词的应用生成已经成为一种成熟的技术。越来越多的平台提供了类似功能，让用户可以通过简单的提示词来生成交互式应用。这大大降低了开发AI应用的门槛。

行业思考

尽管技术进步显著，但一些基础问题仍待解决：

模型的可靠性和"幻觉"问题仍然存在
如何让普通用户更好地理解和使用这些强大但复杂的工具
基础设施建设的环境影响
AI生成内容（"slop"）的质量控制

展望未来

随着合成训练数据的效果被证实，模型训练成本的持续下降，以及效率的不断提升，AI大模型技术正在走向更加成熟和实用的阶段。但要充分发挥其价值，我们还需要更多的教育工作，帮助用户理解这一强大而复杂的工具。

这场技术革命才刚刚开始，2025年我们很可能会看到更多令人惊喜的突破。对于普通用户来说，现在正是了解和学习如何利用这些工具的最佳时机~

Hika 致力于让大家多维度地探索学习这方面知识: 对抗「懒人回答」: 我们做了款让你变得更聪明的AI搜索工具，现在免费用

山尽写东西的cache

我叫山尽，是一个靠国外公开课实验跟开源项目三本逆袭bat的横杠青年，之前在shopee，目前在grab工作。关注我，我会分享如何拿到大厂offer，如何修炼技术，如何提升职场经验，一步一步打怪成为大神。

最新文章

2024年AI大模型发展趋势综述

2024, 我借AI之力, 打造了上线首月用户破万的产品

我All In AI创业一年后, 成绩如何?

对抗「懒人回答」: 我们做了款让你变得更聪明的AI搜索工具，现在免费用

揭开语言模型的神秘面纱:提示就是一切

一行代码，激活本地版ChatGPT：llamafile带来的AI革命

致傲慢的面试官们，别再膨胀吹逼了！

谁说弄懂了《算法导论》的 90%，就超越了 90%的程序员？

Profile-guided optimisation (PGO) on Grab services

2024, 我筹备两年的计划正式开始, 润! 海外!

各位, 我All In AI创业了!

一行代码，激活本地版ChatGPT：llamafile带来的AI革命

我面试了参与制定 IPv6协议，TCP协议的44岁的印度程序员

致傲慢的面试官们，别再膨胀吹逼了！

低效能程序员的七个习惯

谁说弄懂了《算法导论》的 90%，就超越了 90%的程序员？

探索 LLM 和 LMM 的未来发展方向：从多模态到实时交互

我的创业项目, WiseNote封闭测试群

各位, 我All In AI创业了!

一行代码，激活本地版ChatGPT：llamafile带来的AI革命

我面试了参与制定 IPv6协议，TCP协议的44岁的印度程序员

致傲慢的面试官们，别再膨胀吹逼了！

低效能程序员的七个习惯

谁说弄懂了《算法导论》的 90%，就超越了 90%的程序员？

最后一天读者福利! 我的海外求职星球, 即将恢复原价199

最后一周读者福利! 我的海外求职星球, 即将恢复原价199

精心挑选你读的每一样东西, 你读的塑造了你

为什么全世界域名根服务器只能有 13 台??

DNS的镜像服务器与任播, 看完就懂了DNS的一生

体制内生娃成为考核目标, 体制内外“生殖隔离” ？体制外不接受体制内?

知乎万赞：看完这篇再问三次握手就教面试官做人

计算机内功修炼, 看 SICP 不如先看The Little Schemer

2024, 我筹备两年的计划正式开始, 润! 海外!

任何人都要学点逻辑, 无意义的争论可以减少90%, 不付费不卖课, 免费分享

Redis作者长文总结LLMs, 能够取代99%的程序员

靠AI写稿, 一周赚超2000元. 2023, 我的副业大总结

设计分布式系统: 代码都不用写的简明粗暴名字发现服务

程序员们，珍惜你的生命！

读完《奇特的一生》后，你先别激动

致傲慢的面试官们，别再膨胀吹逼了！

执行二进制linux内核居然报错 No such file or directory

人生第一次画漫画：教你怎么用偷看进程在干啥

我挺认同的音乐审美排行榜

听歌赏现代诗：专辑《每个人的一生都是一次远行》

香港乐坛重歌词

转行 Go 工程师，从学习到面试通关秘籍！

山尽的高质量精选文章合集

在macbook装上arch Linux，并日常工作使用了一年是什么体验？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉