今天是2025年01月04日,星期六,北京,天气晴。
今天是2025年的第一个非工作日。
2024年12月31日晚,老刘在社区做了2024年年终技术演讲,这是社区的传统了,我们在23年做了一次,感觉不错,觉得这个传统要延续下去,所以又做了一年。整体还不错,我把把其中的一些重点发出来,供大家一起参考。回放跟ppt原文见社区,欢迎加入社区,一同成长。
我们从ChatGPT两周年的大背景、2024年大模型每月大事件回顾、2024年大模型取得的成就与妥协、2024年RAG\知识图谱\文档理解上的技术变化、2024年老刘说NLP社区建设情况汇报、2025年的展望与期待等几个方面进行了回顾。
大家一起加油。
一、ChatGPT两周年后的回顾
ChatGPT转眼2年了。2018年,OpenAI发布了最早的一代大型模型GPT-1。
2019年,GPT-2发布,模型参数量提高到15亿个。
2020年,GPT-3诞生,参数量达到了1750亿个,其训练参数是GPT-2的10倍以上。
2022年1月,OpenAI对GPT-3用监督式训练进行了微调,并且进行迭代,最终发布了InstructGPT。
2022年11月30日,OpenAI正式发布了ChatGPT,与InstructGPT是姐妹模型,能够对话的GPT版本,是在GPT-3基础上的3.5版本。
2023年,3月15日,OpenAI正式推出GPT-4。2024年5月14日,OpenAI推出新旗舰模型GPT-4o。
2024年9月13日,OpenAI发布o1模型,并在ChatGPT和API接口渠道上推出该系列的预览版本OpenAI o1-preview,OpenAI o1包括三个型号,除o1-preview之外还将有o1和o1-mini。
两年前,我们还是在摸索其上线,用对话框的形式聊聊天,写写诗;
两年后,大模型已经渗透到了我们生活的各处;
我们在23年的时候,预测在2024年要关注CoX的力量,这一刻也应验了,openai o1的发布,掀起了后续慢思考的热潮;
我们也预测24年moe、多模态大模型的爆发,在2024年也得到验证。
二、2024年大模型每月大事件回顾
2024年,12个月,摊开后,能够明显的看到整个技术和产业的发展变化。
1月份开年moe+长文本2月份OpenAIsora开启视6月份国内开始价格战9月份OpenAI发布o1模型开启推理模仿潮12月份OpenAI举行为期12天的活动发布多个新产品
三、2024年大模型的一些成就与妥协
成就上,给2025年打下一个很好的基本盘:
多模态大模型全面开花-语音/图片/视频/理解等
大模型在长文本上/多size/MOE的能力得到长足进展大模型产业基础设施基本建成
妥协上,依旧有很多并不那么理想化的现实:
领域大模型pretrain/微调提的少了,RAG无处不在。
Agent的饼逐步被戳破,workflow的本质越来越为大家所认识
知识图谱与大模型的结合以一种新的形式回来了,但依旧举步维艰
任务提升回归到任务拆分,分而治之慢思考+细分解体步骤提升效果
大模型现在还打不平,不是个好生意
四、从技术微观上,有哪些工作还可以继续
大模型时代下数据合成成为重要方向。
OpenAI O1后时代下的慢思考范式拓展。
从RAG到RAG N.0,RAG建模为端到端优化问题
五、2024年老刘说NLP社区建设回顾
7年历程下2次转变,这是一个技术人的一些历程,贵在坚持。
2024年老刘说NLP技术文章建设:340+文章/30+专题写作
2024年老刘说NLP线上交流建设:历史三十五讲,全年累计25讲
2024年300+每日早报建设:从2月份开始连续11个月
2024年代表专题工作建设:围绕文档理解+知识图谱+RAG的17个专题
2024年老刘课堂建设:知识图谱、大模型、RAG课堂三部曲
2025年的展望
技术没有最好,只有更合适;对技术保持敬畏之心,保持长期主义,保持自省,保持谦逊之心,不卑不亢,不悲不喜。
放眼2025年,让自己更具备实践能力,管理好自己的预期。技术本身是没错的,技术也不会泡沫,泡沫这些都是外部推力所营造的,所以这很主观,不存在所谓泡沫,只存在决定这个泡沫是否产生的预期管理,预期管理的好,那么看到的就是希望,否则则是一地鸡毛。搜索能力、提问能力、动手能力,始终是当前时代不会错误的能力,大家需要修身、保持自律。
让我们在2025年继续前行,也欢迎更多朋友加入社区大家庭。
关于我们
老刘,NLP开源爱好者与践行者,主页:https://liuhuanyong.github.io。
对大模型&知识图谱&RAG&文档理解感兴趣,并对每日早报、老刘说NLP历史线上分享、心得交流等感兴趣的,欢迎加入社区,社区持续纳新。
加入会员方式:关注公众号,在后台菜单栏中点击会员社区->会员入群加入