完整o1 模型即将发布!刚刚Sam Altman和团队答疑:今年不会有GPT-5,但多个AGI项目正在路上

文摘   2024-11-01 08:14   上海  

(关注公众号并设为🌟标,获取最新人工智能资讯和产品)

全文约1,500 字,阅读约需 3分钟

2024年10月31日,OpenAI的首席执行官Sam Altman以及其核心团队成员在Reddit上进行了“Ask Me Anything”(AMA)线上答疑活动。此次活动涵盖了多个主题,包括:

  • ChatGPT的搜索功能

  • OpenAI o1和o1-mini模型

  • 高级语音技术

  • 研究路线图

  • 计算机代理的未来

  • 通用人工智能(AGI)

  • 即将推出的功能

  • 以及其他与OpenAI相关的话题

参与AMA的OpenAI高管包括:首席执行官Sam Altman 、 首席产品官Kevin Weil 、研究高级副总裁Mark Chen 、工程副总裁Srinivas Narayanan 、首席科学家Jakub Pachocki 。

此次活动为用户提供了与OpenAI高层直接交流的机会,解答了关于人工智能技术、产品发展和未来规划等方面的疑问。面对数千条提问,我们提取了其中的关键话题和要点,供大家学习和思考。

核心话题讨论

1、关于愿景与未来

Q: Ilya 究竟看到了什么?

A: Sam Altman: "是超凡的未来。Ilya 是位非凡的未来主义者,他比几乎任何人都能更清晰地洞察未来。他的早期理念、热情和愿景对我们许多工作都产生了重要影响。特别是,他是最早探索和倡导那些最终演变成 o1 项目的关键理念的人之一。这个领域有他的参与是一种幸运。"

Q: 现有硬件能否实现 AGI?还是需要全新的硬件架构?

Sam Altman: "我们相信AGI可以基于当前硬件实现。"

2、产品发展规划

Q: ChatGPT-5 或类似版本何时发布?会有哪些新特性?

Sam Altman: "我们今年会有一些令人振奋的发布!但不会称之为 GPT-5。"

Q: ChatGPT 未来是否能自主执行任务并主动联系用户?

 Kevin Weil (首席产品官): "在我看来,这将是 2025 年的一个重要发展主题。"

Q: Sora 推迟发布的原因是计算量/时间的限制,还是安全考虑?

Kevin Weil: "需要进一步完善模型,确保安全性和防伪等方面更加完善,同时还需要扩大计算规模!

3、实践与应用

Q: 您见过的最佳个人助理应用场景是什么?

Srinivas Narayanan (OpenAI 工程副总裁): "有两个特别令人印象深刻的场景:

  • 1.用于总结医疗报告,帮助患者向医生提出更有针对性的问题
  • 2. 用户上传个人知识创建定制化 GPT 供他人使用(如朋友分享课程笔记或旅行建议)——这是一个仍未被充分开发的应用场景"

4、人才与发展

Q: 对想要参与 AI 变革的年轻人有什么建议?

Kevin Weil: "我的建议是每天都要使用它。利用它来学习各种技能——编程、写作、产品设计等。如果你能比他人学习得更快,你就能实现任何目标。

Srinivas Narayanan: "将 AI 工具应用到日常工作中提升效率,这会激发你产生创新想法。然后将这些有趣的想法付诸实践并与他人分享。"

Q: 如果现在是 15 岁,你会专注发展哪些技能来为未来做准备?

Srinivas Narayanan: "适应能力和学习方法的掌握可能是最重要的。"

5、团队发展

Q: 面对高层人员离职,团队如何应对压力?

Srinivas Narayanan: "虽然失去一些密切合作的同事令人遗憾,但我们拥有一支才华横溢的团队,最近也有很多优秀人才加入。而且我们持续推出新产品,这是最重要的。

其他要点

1、产品发展规划

模型演进

  • GPT 和 o1 两个系列将继续并行发展,预计未来会融合
  • 完整版 o1 模型即将发布,相比预览版将有显著提升
  • 正在开发新的文本转图像模型,o1 将在未来几个月支持图像输入、多模态及工具使用功能
  • 刚刚发布ChatGPT search可以快速、及时地获得答案以及相关网络资源的链接

上下文窗口

  • 正致力于扩展 ChatGPT Plus 和 GPT-4o 的上下文窗口
  • 当前 32k 令牌限制难以满足较长任务需求,特别是编程和写作场景

语音与视觉

  • 正在开发高级语音模式(AVM)和相机模式
  • 计划放宽音乐相关限制,包括赋予 ChatGPT 唱歌能力
  • 提升了模型处理中断的能力

成本优化

  • 过去一年推理成本降低约 90%
  • GPT-4o-mini 的运营成本仅为原始 GPT-3 的 2%
  • 包括语音在内的高级功能成本有望继续下降

2、技术突破与改进

多语言能力

  • GPT-4o 在多语言处理方面取得重大进展
  • 持续提升英语之外的语言表现
  • 多语言能力仍是重点发展方向

准确性提升

  • 致力于减少"幻觉"现象
  • 通过强化学习提高准确性
  • 改进可靠来源引用能力

3、合规与安全

内容管理

  • 计划为成年用户提供 NSFW 内容控制选项
  • 当前优先级较低,待资源允许时实施

开源策略

  • 认可开源模型在 AI 生态系统中的重要性
  • 目前专注于提供安全可靠的 API 服务
  • 未来有望开源更多模型

监管合作

  • 承诺遵守欧盟政策法规
  • 支持制定合理的行业规范

4、 2025年展望

  • ChatGPT 自主任务执行能力将成为重要特征
  • 智能代理有望成为 GPT 产品线的重大突破
  • 预计各项基准测试指标将达到饱和水平
  • 用户能够发现产品价值,尽管原型存在局限
  • 持续关注用户需求,推动产品改进


参考链接:https://www.reddit.com/r/ChatGPT/comments/1ggixzy/ama_with_openais_sam_altman_kevin_weil_srinivas/?rdt=61377

素材来源官方媒体/网络新闻

不只是算法,我们在创造改变生活的可能。您是否曾想过AI技术能为您的事业带来突破?现在,这个机会就在眼前,欢迎扫描下方二维码或点击链接填写AI需求,来和我们聊聊。

https://kawecob6a7k.feishu.cn/share/base/form/shrcn9i5HkwtHpkQNaV1bDqjt8f,会有相关负责人及时联系您,请留意您的微信和邮箱信息。

往期回顾

[1、Anthropic CEO 万字长文:我认为AGI最早会在 2026 年出现,机器可以像人类一样协助办公

[2、演讲总结:未来学家凯文·凯利刚刚亮相2024上海外滩大会,预言AI时代三大趋势,未来所有工作都会使用人工智能

[3、强烈推荐:红杉资本刚刚发布关于 AI 的2024年度报告,有几个非常重要的关键节点


想象一个世界,AI不再是遥不可及的科技,而是每个人的得力助手。我们将 AI 科技与创新想法完美融合,探索无限可能!

告别昂贵服务和缺人烦恼,再见漫长交付周期

无限创意,分分钟生成专业级产品

感受 AI 带来的全新工作体验!

欢迎各大品牌方、媒体、企业和个人等

请联系负责人微信:Milo-1101

--END--


AI深度研究员
AI时代刚刚到来,一切才刚开始,我们正当其时!
 最新文章