首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

RWKV作者对OpenAI 发布 o1 系列模型的看法，很深刻

科技 2024-09-14 00:01 北京

知乎：PENG Bo

链接：https://www.zhihu.com/question/666991594/answer/3624168868

大家都知道长期CoT可以提升性能，而且很快我们会看到其它家的例子，这是最后的low-hanging fruit，因为只需合成大量训练数据，包括动态去合成有针对性的训练数据。

例如，我去年7月演示过，一个2.9M参数量的超小RWKV-4配合长期CoT可以精确解决各种复杂四则运算：

https://github.com/BlinkDL/RWKV-LM/tree/main/RWKV-v4neo/math_demo （训练数据合成时覆盖不够全面，数字别写太长太多，但可以随意换其它随机数字）

如果用RWKV这样的RNN模型，无论做多久的CoT，消耗的显存，和生成每个字的速度，都是恒定的，因此尤其适合做长期CoT。相当于在state的潜空间做长期的行走。

数学和代码，尤其适合通过这种方法提升。而且还可以配合MCTS。而且模型可以调用外部工具验证，可以自己纠错（这个看上去还没开放，估计因为OAI认为目前对于公众开放这种就显得过于强）。

我一直认为，这个方法一直做下去，足够做到"伪AGI"，替代99+%的人类工作。因为人类在99+%的时候没有智能。

然后，水涨船高，大家会习以为常，这会commoditize。

剩下的才是真正有趣的问题，例如真正的创意，真正的洞察力，超越时代的想法，在没有路的地方走出路来，也包括真正的感悟和体验，因为这些事情的验证标准是不明确的。

人类是怎么想到这些事情的，是目前的大模型无法理解的。就像，拉马努金说他是梦到的。

当然，这些也有办法解决，只不过，如果知道的人不说，不知道的人（或模型）就不可能想出来。

例如，写作是最简单的，又是最难的。

这就像什么呢？就像一直有很多人爱吹OAI，就像高赞回答爱吹。因为，太多的事物，在不懂的人看来是神奇的（因为他们不可能想出来），在懂的人看来是trivial的（因为不用想就知道）。

令人遗憾的现实是：不懂的人，做再多CoT，也是不可能懂的。所以CoT不是万灵药。

http://mp.weixin.qq.com/s?__biz=MzIxNDgzNDg3NQ==&mid=2247546862&idx=3&sn=b315dd14d0c97c19a82d92d49a844c4e

深度学习与NLP

专注深度学习、NLP相关技术、资讯，追求纯粹的技术，享受学习、分享的快乐。

最新文章

阿里史上最大规模开源发布，超GPT-4o 、Llama-3.1！

硕博招生将启！AI排名跻身前15，全球首所人工智能大学MBZUAI实力大增

谷歌女高管被裁员，3份兼职越干越开心！55岁正是闯的年纪！

李飞飞等14位斯坦福微软大牛等撰写《AGENT AI: 综述多模态交互的前沿展望》免费pdf分享

李飞飞等14位斯坦福微软大牛等撰写《AGENT AI: 综述多模态交互的前沿展望》免费pdf分享

痛惜！张祺乐副教授离世，年仅38岁……

下载量10w+！LLM经典《大型语言模型：语言理解和生成》pdf免费分享

OpenAI o1 self-play RL 技术路线推演

大模型千卡训练指南

逆天20w赞！吴恩达+Open AI打造《大模型通关指南》

[送5本]《架构思维：从程序员到CTO》揭秘程序员如何培养架构思维！

o1方法性能无上限！姚班马腾宇等数学证明：推理token够多，就能解决任意问题

对大模型演进方向的思考

52k star，北大内疯传《大学生CS自救指南》免费分享

被美国“制裁”的中国大学名单。。。

o1基石论文火爆传阅，Ilya仍是关键先生！核心项目清北校友闪光

技术上，如何复现 o1?

前英伟达科学家Anima Anandkumar斯坦福大学演讲，用实际案例揭示AI在这些领域的巨大潜力

10w网友点赞！清华大学《大模型研讨课》免费分享

36岁当上985高校院长！女教授称“最强大的背景”是......

吴恩达力荐LangChain经典课程-《LangChain大型语言模型(LLM)应用开发》免费分享

北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式

大模型千卡训练-经验指北

如何用1024张显卡训练一个模型

Github 13w Star，吴恩达强推《ChatGPT提示词工程》课程视频、配套代码及笔记分享

2024最新版，人大赵鑫老师《大语言模型》新书pdf分享

对大模型演进方向的思考！

李飞飞任CEO，空间智能公司World Labs亮相，全明星阵容曝光

张俊林-浅谈OpenAI o1的价值意义及RL 的Scaling Law

8月最新大模型新书-《自然语言处理：大模型理论与实践》西财赵宇教授新作

54K收藏神书-《Prompt 学习指南》中文版免费分享

李飞飞等14位斯坦福微软大牛等撰写《AGENT AI: 综述多模态交互的前沿展望》免费pdf分享

MOE vs MOT 让LLM更加有效

[送5本] 千问 | 面壁等团队强推《大型语言模型实战指南》新书分享

RWKV作者对OpenAI 发布 o1 系列模型的看法，很深刻

突发！OpenAI发布最强模型o1：博士物理92.8分，IOI金牌水平

下载量超5w！机器学习入门圣经《机器学习导论》最新第四版PDF免费分享

下载量10w+！LLM经典《大型语言模型：语言理解和生成》pdf免费分享

2024最新,李宏毅深度学习教程pdf免费分享！绝对值得反复阅读的神书！

谢尔盖布林：谷歌不敢用Transformer，作者剩一人了，现在我每天都在写代码

中科院提出大模型“基准泄露”排行榜，Qwen模型位居榜首

2024年新书-《掌握大语言模型》免费pdf分享

13万下载，亚马4.8高分，麻省开源《理解深度学习》分享！

麻省理工开源：《理解深度学习》，中文版来了！

下一代RAG：MemoRAG

华为三折叠手机19999元起！全展开10.2寸大屏3.6mm厚度，电池只留1.9mm

【包教包会】速通LLM《从头开始构建大型语言模型》免费pdf分享

Andrej Karpathy：自动驾驶已经实现 AGI，汽车其实就是机器人

Transformer已经彻底凉凉了！

2024最新版，人大赵鑫老师《大语言模型》新书pdf分享

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉