点击下方卡片,关注“CVer”公众号
点击下方卡片,关注“CVer”公众号
AI/CV重磅干货,第一时间送达
AI/CV重磅干货,第一时间送达
添加微信号:CVer2233,小助手会拉你进群!
扫描下方二维码,加入CVer学术星球!可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料,及最前沿应用!发论文/搞科研/涨薪,强烈推荐!
添加微信号:CVer2233,小助手会拉你进群!
扫描下方二维码,加入CVer学术星球!可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料,及最前沿应用!发论文/搞科研/涨薪,强烈推荐!
梦晨 发自 凹非寺
转载自:量子位(QbitAI)
猛料来了,OpenAI下一代旗舰模型被曝提升不如预期。
消息来自The Information,具体指代号“猎户座”(Orion)的模型相对GPT-4的提升幅度,小于GPT-4相对GPT-3,已进入收益递减阶段。
或许这也是奥特曼曾说,可能不会把新模型命名为GPT-5的原因之一。
消息一出,著名悲观派学者Gary Marcus直接半场开香槟,宣布自己胜利。
在更详细的一篇文章中,他认为整个AI行业公司的高估值建立在模型能力不断增强、迅速达到AGI的预期之上。
如果改进放慢了,多数AI公司都能赶上最前沿模型的水平。从此行业进入价格战,收入保持在低位。同时因芯片成本高昂,利润也将难以获得。
当每个人都意识到这一点时,金融泡沫可能会迅速破灭,即使是英伟达也可能受到打击。
并且遇到瓶颈的或许不只是OpenAI,此前Anthropic没有如期发布Claude 3.5 Opus,并且从官网删除了相关描述。
以及谷歌Gemini 2虽然计划很快发布,但也被曝性能提升也不及DeepMind创始人的预期。
大模型Scaling Law真的撞墙了吗?
“猎户座”被曝不及预期,奥特曼:AGI 2025
根据目前消息,长期跟踪ChatGPT进展和网页源码的“光头哥”Tibor Blaho总结如下:
参与测试新模型的OpenAI员工称, “猎户座”仅完成20%训练时就达到了GPT-4级别的性能。
但最终质量提升小于从GPT-3到GPT-4的飞跃,这表明传统的Scaling可能由于高质量数据变得有限而放缓。
训练“猎户座”使用了先前模型(GPT-4和o1)生成的数据,可能导致它重现旧模型的一些行为。
OpenAI创建了一个“基础团队”,在高质量数据供应减少的情况下寻找新方法。
o1类模型成本是传统模型的6倍,“猎户座”可能提高OpenAI数据中心的运营成本,进一步增加财务压力。
OpenAI正在做“猎户座”的安全测试,计划于明年初发布,可能不会再命名为GPT系列
与此同时,从OpenAI CEO和许多资深员工那里,传来的却是不同的故事。
首先是奥特曼接受YC总裁Garry Tan采访,在回答最后一个问题“2025年什么会让你兴奋”时,脱口而出“AGI”,没有半秒犹豫。
这段采访引起争议后,强化学习大牛Noam Brown发声:
我听人们说奥特曼只是在炒作,但从我的观察来看,他说的一切都符合OpenAI一线研究员的中位数观点。
今年1月才入职OpenAI的特斯拉前工程师也表达了认同:
自从我加入以来,我的观点已经从“这是毫无成效的炒作”转变成“AGI基本就在这里”
恕我直言,接下来的科学创新会相对很少,将由多年的艰苦工程代替。
那么,究竟发生了什么?
在Garry Tan与奥特曼的对话中,两人从奥特曼早期在YC的经历,谈到OpenAI的创立、发展过程,以及给如今创业公司的建议等等。
在接近结束的时候,Garry Tan抛出了这样的问题:你从去年秋天的动荡中学到了什么?你对一些人员离职有什么感受?
奥特曼回答:很累,但感觉很好。
ChatGPT还不到两岁,我们有点像在两年内速通了中型甚至大型科技公司的发展历程,通常需要十年时间。
这带来了很多痛苦的事情。任何公司在扩张时,都会以某种速度经历管理团队的更替。擅长从0到1的人不一定适合从1到10或从10到100的阶段。
……我希望我们现在正走向一个更平稳的时期,但我确信将来还会有其他时期,事情会再次变化剧烈。
Garry Tan接着提问:我想知道OpenAI现在运作的如何?目前的质量和推进速度如何?
奥特曼接下来的回答虽然一如既往的打太极,但引起很多关注:
这是我们第一次真正知道该做什么。构建AGI仍然需要大量的工作,有一些已知和未知,还需要一段时间,而且会很困难,但这非常令人兴奋。
……我们的研究路径相当清晰,我们的基础设施路径相当清晰,产品路径也越来越清晰……很长一段时间,我们都不是这样。
评论区网友显然不买账,有人怀疑这只是奥特曼在试图修改AGI的定义,按照合同,一旦董事会宣布AGI达成,就可以停止与微软分享技术了。
也有人指出,这无法解释最近OpenAI人才频繁出走。
对于人才流动,OpenAI模型架构研究员Rohan Pandey表示并没有人们以为的那么严重。
今年早些时候OpenAI员工总数被曝已超过1700,比去年董事会叛变时期增加了上千人。
也有网友认为,反过来也说得通:
OpenAI高管看到技术进展很快,所以提前离开去创办AI智能体公司。
参考链接:
[1]https://www.theinformation.com/articles/openai-shifts-strategy-as-rate-of-gpt-ai-improvements-slows
[2]https://www.youtube.com/watch?v=xXCBz_8hM9w
[3]https://garymarcus.substack.com/p/confirmed-llms-have-indeed-reached
[4]https://www.theverge.com/2024/10/25/24279600/google-next-gemini-ai-model-openai-december
[5]https://x.com/btibor91/status/1855381376054251654
何恺明在MIT授课的课件PPT下载
在CVer公众号后台回复:何恺明,即可下载本课程的所有566页课件PPT!赶紧学起来!
ECCV 2024 论文和代码下载
在CVer公众号后台回复:ECCV2024,即可下载ECCV 2024论文和代码开源的论文合集
CVPR 2024 论文和代码下载
在CVer公众号后台回复:CVPR2024,即可下载CVPR 2024论文和代码开源的论文合集
Mamba、多模态和扩散模型交流群成立
扫描下方二维码,或者添加微信号:CVer2233,即可添加CVer小助手微信,便可申请加入CVer-Mamba、多模态学习或者扩散模型微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。
一定要备注:研究方向+地点+学校/公司+昵称(如Mamba、多模态学习或者扩散模型+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群
▲扫码或加微信号: CVer2233,进交流群
CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集上万人!
▲扫码加入星球学习
▲点击上方卡片,关注CVer公众号
整理不易,请赞和在看