OpenAI的Q计划:“Strawberry"新模型,可自主浏览互联网并自主推理

文摘   2024-07-16 07:16   北京  

在人工智能领域的一片喧嚣中,OpenAI再次投下了一枚震撼弹——代号“草莓”(Strawberry)的新项目。据路透社最新报道,这家科技先锋正紧锣密鼓地研发一款旨在革新人工智能推理能力的模型,其潜力之大,足以让业界内外屏息以待。

草莓:从Q*到未来的飞跃

“草莓”项目,原名Q*,于去年在OpenAI内部被视作一项突破性进展。尽管具体细节仍然笼罩在神秘面纱之下,但该项目的雄心已显露无疑:打造一个不仅能解答疑问,更能自主地在互联网上进行深度探索与研究的人工智能。这标志着AI将不再局限于被动反应,而是能够主动出击,进行信息的搜集、分析乃至基于数据采取行动,为科学发现、软件开发等高复杂度领域带来革命性变化。

后训练:通往智能巅峰的秘密武器

“草莓”项目的核心在于其独特的后训练(post-training)技术。这一创新流程意味着模型在完成初步的海量数据训练后,还将经历精细的调整和优化,类似于对一位学富五车的学者进行针对性的深造。微调(fine-tuning)便是其中的关键环节,它依赖于人工反馈和示例,引导模型在正确与错误之间形成更为精准的判断力,从而提升其决策质量。这种“再教育”过程,有望让AI的智能水平跃上新的台阶。

自我学习的奇迹:STaR的灵感

“草莓”项目的另一亮点在于借鉴了斯坦福大学的“自学推理者”(Self-Taught Reasoner, STaR)概念。这项技术允许AI通过自我生成训练数据来逐步提升自身智力水平,理论上能够促使语言模型超越人类智慧的界限。斯坦福大学教授Noah Goodman对此表示既兴奋又担忧,认为若AI持续进化,人类社会将迎来前所未有的挑战与反思。

长周期任务与深度研究的实践者

“草莓”模型被寄予厚望,旨在执行长期规划与连续行动的任务,如LHT(长周期任务)。OpenAI正运用一种特殊的“深度研究”数据集来训练和评估模型,虽然该数据集的具体内容和应用范围尚不明确,但其目标明确:使AI在计算机使用代理(CUA)的帮助下,自主浏览网络,根据发现采取行动,并探索在软件开发与机器学习工程中的应用潜力。

私密研发,公众期待

尽管OpenAI内部对“草莓”项目的具体运作方式守口如瓶,外界仍能感受到即将到来的技术风暴。公司发言人透露了他们对AI的愿景——使之具备如同人类般的认知与理解能力。虽然目前大型语言模型在处理复杂信息方面展现出惊人速度,但在常识性推理上仍显不足,常出现“幻觉”现象,提供错误信息。因此,“草莓”项目被视为提升AI推理能力、克服这一短板的关键尝试。

未来之路:机遇与挑战并存

随着“草莓”项目的推进,全球人工智能专家约舒亚·本乔再次敲响警钟,警告私人企业竞相开发与人类同等甚至更高级别AI可能带来的风险,包括极端情况下的人类生存威胁。他呼吁科学界和社会各界携手,共同寻找监管高级AI的有效途径,确保技术进步与人类福祉并行不悖。

“草莓”项目不仅是OpenAI的又一里程碑,更是全球人工智能发展历程中的重要一步。它不仅承载着技术突破的梦想,也引发了对伦理、安全和人类未来角色的深刻讨论。在这个人工智能飞速演进的时代,让我们共同见证并参与这一历史性的转变。

未来出行:无人驾驶能否取代网约车司机?

AI Agent:大模型演进的下一站

OpenAI CEO携手Thrive,创办AI健康公司

2024国产AI大模型应用报告

大模型与小模型:AI领域的双轨并行与未来趋势

2024上半年《人工智能现状报告》750名行业领导者、技术人员的意见

三星支持荷兰初创公司Axelera:开发全球最强大的边缘AI芯片

Runway推出GEN3 Alpha模型!

全球首款支持 GPT-4o 的智能眼镜 Solos AirGo Vision 发布

Resona V2A: AI智能解析视频,实现自动配音与配乐

AI文档搜索公司Hebbia融资超1.2亿美元,估值达8亿美元

字节跳动推出“豆包MarsCode”智能编程助手:国内开发者免费使用

每首歌索赔15万美元索尼、环球音乐、华纳起诉 Suno 和 Udio

OpenAI 收购远程协作平台 Multi,在企业解决方案领域发力!

腾讯元宝新版本发布:提升解析能力,支持1000万字超长文处理

RTranslator:全球首个开源实时翻译神器

OpenAI 前首席科学家 Ilya创办新 AI 公司,聚焦超级智能安全

AI Agent进入红海时代,开发者的红利时代来了

2024年美国科技行业裁员潮持续:从巨头到初创企业,60,000名员工面临失业

【AI+考试】30秒出题,1分钟开考,万物皆可考!

GPTZero:人工智能内容检测领域的黑马

PixVerse Magic Brush 上线:7 个示例教你玩转对象移动

LLM推理能力盲区:从《爱丽丝梦游仙境》测试看AI的局限与未来方向

快手发布视频大模型“可灵”:能生成2分钟1080p高质量视频

Qwen2模型家族来了

数名OpenAI、谷歌、DeepMind现任和前任员工,签署公开信警告人工智能风险

SD3 Medium 模型即将开源

AI 服务集体宕机:ChatGPT 领衔,Claude 和 Perplexity 紧随其后

NVIDIA 在 GDC 2024 推出全新数字人技术和 RTX SDK

AI在不同场景下如何提升效率,能否完全取代人类?

我是腾讯元宝,看透繁杂,听懂所需,说享精彩!

OpenAI官宣:已开始训练下一代“前沿AI模型”

马斯克融资60亿美元,计划推出xAI超级计算机

SignLLM:通过文字描述生成手语视频的多语言模型

美国「AI开源大模型」出口管制法案:43 比3通过第一轮

Truecaller:帮你接电话的AI助手来了

使用AI克隆拜登声音,被罚600万美元

大模型价格战升级!阿里、百度、字节跳动争相“降价”,大厂火拼,价格亲民

面壁智能MiniCPM-Llama3-V 2.5实力碾压GPT-4V、Gemini Pro,成为端侧多模态新霸主

FunClip:开源的AI视频自动化视频剪辑工具

国产大模型激战正酣:开源与低价的精彩对决

OpenAl发布GPT-4o全能模型,实时语音和视觉能力,再次刷新业界

探索未来网页设计:Wegic AI对话式建站助手!

月薪8千和月薪3万的区别:有没有熟练使用天工AI!

阿里云发布通义千问2.5:超越GPT-4 Turbo

全国首例“AI外挂”案:游戏世界的黑暗角落

微软为美国情报机构定制 GPT-4 生成式 AI 模型!

Logo Diffusion:打造个性化Logo的AI平台

支付宝智能助理:你生活琐事的“超级管家”

DrEureka:AI让机器狗玩瑜伽球,平衡能力简直绝了!

Copilot Workspace:告别孤独的编码之夜,迎接你的智能副驾

【AI+农业】AI育种大模型“丰登”问世 为粮食安全提供科技支撑

第七代机器人‘凤凰’,接近人类学习速度,24小时内掌握新技能

Danny Postma:从独立黑客到百万美元初创企业

Qwen1.5-110B:首个千亿参数语言模型新篇章

生数科技发布可生成最长 16 秒、1080P 视频的类Sora模型:Vidu

“Coze”上岗,你安心躺平:让AI Bot为你打工

腾讯旗下协作SaaS产品,全部接入混元大模型,重构协作应用生态

AI声音侵权第一案”宣判,配音师获赔25万,多位配音演员发声支持

【AI+电商】iFoto免费AI平台八大功能,赋能电商企业提升效率!

免费算力资源加持!阿里云百炼平台支持Llama3模型,助力企业与开发者构建专属大模型!

医疗人工智能:Hugging Face推出Open Medical-LLM基准测试

【AI+教育】教育部打造大模型应用,国家智慧教育平台将上线“AI学习”专栏

▲ 滑动查看往期内容

小微模型
一起探索AGI世界,解锁AI实用技能,伴您步入智能生活!
 最新文章