马斯克再谈约架扎克伯格:随时奉陪/传满血版 o1 下月推出/苹果或将推出 AI 智能家居中控屏 | Hunt Good 周报
科技
2024-11-17 11:57
广东
欢迎收看最新一期的 Hunt Good 周报!在本期内容你会看到:8 条新鲜资讯 7 个有用工具 1 个有趣案例 3 个鲜明观点Hunt for News|先进头条🧑⚖️ 马斯克与 OpenAI 的法律纠纷再升级本周,埃隆·马斯克与 OpenAI 的法律纠纷再次升级。诉讼新增了联邦反垄断等多项索赔,并把微软列为共同被告。马斯克方面指控 OpenAI 和微软违反了反垄断法规,包括以不与竞争对手交易为条件提供投资机会,以及他们的独家许可协议实质上相当于未经监管批准的合并。马斯克的法律团队指责微软的行为构成了反竞争行为,并表示「阳光是最好的消毒剂」。对此,OpenAI 回应称诉讼毫无根据,而微软则拒绝发表评论。此外,一系列涉及 OpenAI 早期成员,包括马斯克和 Altman 等人的电子邮件被曝光。尽管这些邮件不能完整揭示整个事件的全貌,但一些细节也非常有趣。邮件内容显示,前首席科学家 Ilya 对马斯克的领导能力表示担忧,认为他可能会走向独裁。同时,他对 Altman 也有所质疑,不理解他对 CEO 头衔的执着及其背后的动机。邮件还透露了 2017 年 OpenAI 曾考虑收购芯片制造商 Cerebras,并可能利用特斯拉的资源来完成这一收购,但最终未能实现。早期,马斯克曾希望 OpenAI 能成为他的资产之一,一些联合创始人也有类似的想法,但这一计划并未实现。此外,邮件还显示微软早在 2016 年就有意与 OpenAI 合作,但遭到了马斯克的反对。🔗 https://www.businessinsider.com/emails-between-sam-altman-elon-musk-kicked-off-openai-2024-11❌ OpenAI CEO 辟谣 AI 发展「撞墙」论,满血版 o1 疑似下月推出近期,OpenAI CEO Sam Altman 在 X 平台辟谣 AI 发展「撞墙」论:「there is no wall .没有墙」这一则辟谣源自近日有多家媒体报道称,OpenAI、Anthropic 等多家大模型公司下一代前沿模型训练表现不佳,这也导致 Scaling Laws 疑似「撞墙」的消息不胫而走。此前,OpenAI 前首席科学家 Ilya Sutskever 在接受路透社采访时表示,「通过扩大预训练阶段——即使用大量未经标注的数据来训练 AI 模型,使其理解语言模式和结构——所取得的成果已经停滞不前。」图灵奖得主 Yann Lecun、Ilya、Anthropic 创始人 Dario Amodei 也就此事纷纷展开唇枪舌战。争论的核心在于,随着模型规模的不断扩大,其性能提升是否会遇到天花板。具体信息欢迎回看 APPSO 此前文章 👇OpenAI 最新产品全曝光!奥特曼驳斥 AI 发展撞墙,Ilya 认错,秘密寻找下一个重大突破 作为补充,在这场辩论的背景下,彭博社在近期也披露了一条引人注目的消息。OpenAI 计划在明年一月份推出一款名为「Operator」的 AI Agent(智能体),这个 Agent 能够使用计算机代替用户执行任务,如编写代码或预订旅行。值得注意的是,在 Altman 辟谣的推文评论区中,针对网友询问满血版 OpenAI o1 的发布日期,他回应道:「like for a christmas present? 喜欢圣诞礼物吗?」🔗 https://x.com/sama/status/1856940944169316843🧬 说到做到,AlphaFold 3 重磅开源Google 兑现承诺,重磅开源了 AlphaFold 3。AlphaFold 3 能够与其他分子协同建模蛋白质,预测蛋白质与 DNA 相互作用时的结构,以及评估潜在药物的性能。最初,DeepMind 通过网页服务器提供 AlphaFold 3 的访问服务,但由于限制了预测的数量和类型,且未公开代码和模型权重,遭到了科学界的批评。面对这些反馈,DeepMind 承诺在半年内发布开源版本。11 月 11 日,DeepMind 宣布,科学家们可以下载 AlphaFold 3 的软件代码,用于非商业目的。目前,仅限于具有学术背景的科学家可以根据要求获得训练权重。「我们非常期待看到人们如何利用这个工具,」AlphaFold 团队负责人 John Jumper 表示。上个月,他与 Demis Hassabis 共同获得了 2024 年诺贝尔化学奖。🔗 https://www.nature.com/articles/d41586-024-03708-4🤖 人形机器人天工亮相北京马拉松起猛了,看见人形机器人在北京跑马拉松。11 月 10 日,2024 北京亦庄半程马拉松鸣枪开跑。有趣的是,参赛选手中出现了一位人形机器人「天工」。不过,贴有「天工 001」号码牌的人形机器人并未跑完全程,跑了一分钟左右,就停到场边,向场外观众示意,并在终点处迎接参赛选手。据悉,最新版本的「天工」人形机器人身高达到 1.8 米,最高奔跑速度已提升每小时 12公里。🔗 https://mp.weixin.qq.com/s/HqHYEewdLt31S9Gc3JGLTw😀 后悔抛售英伟达股票,孙正义抱着黄仁勋假装哭泣英伟达 CEO 黄仁勋与软银集团 CEO 孙正义本周同台亮相。在对话开始之前,黄仁勋首先进行了长达一个小时的演讲,向与会者介绍了 AI 的最新技术发展,以及 AI 将如何深刻地改变人类的生活。碰到小插曲,老黄也入乡随俗地连道多句「私密马赛」。在与孙正义的交流过程中,黄仁勋还展示了不少「黄氏」幽默。例如,看到孙正义,先来一段排比句式的彩虹屁,逗得孙正义开颜大笑;打趣孙正义后悔抛售英伟达股票,也调侃自己错失了收购英伟达的最佳时机。「你们中很多人可能不知道,Masa(孙正义)曾经是英伟达的最大股东」听到这话,孙正义搂住黄仁勋,做出一副哭泣的样子,引得在场与会者大笑。更多细节欢迎回看 APPSO 此前文章👇黄仁勋最新演讲:每家公司都将成为 AI 制造商 | 万字实录 🔗 https://www.nvidia.cn/events/ai-summit-japan/fireside-chat/🥊 马斯克再谈与扎克伯格的「笼中决斗」:随时奉陪近期,58 岁的拳王泰森重返擂台,对垒 27 岁的美国网红兼职业拳击手杰克·保罗,最终落败。在这场泰森与保罗的重量级比赛进行之际,一位网友提问:特斯拉 CEO 埃隆·马斯克和 Meta CEO 马克·扎克伯格之间的比赛何时进行?对此,马斯克现身评论区回应称,这场比赛可以随时举行。「Anytime, anyplace, any rules are fine by me 随时、随地、任何规则我都没问题。」去年 6 月份,马斯克在 X 平台宣称他要和扎克伯格进行一场「笼中约架」,双方经过多轮呛声之后,马斯克的母亲宣布取消了这场比赛,并劝告网友不要起哄,希望两人不要真的动手。看热闹不嫌事大,如果开打,你觉得谁会赢?🔗 https://x.com/Nate\_Esparza/status/1857658369391341604🍎 传苹果将推出 AI 智能家居中控屏据彭博社的 Mark Gurman 报道,苹果公司正在开发一款新的智能家居产品——一款壁挂式显示屏,拥有控制家电、与 Siri 互动和视频会议等功能。显示屏看起来像一个方形的 iPad,拥有大约 6 英寸的屏幕,顶部配有摄像头,内置扬声器和可充电电池。其已开发三年,可能会在明年 3 月正式宣布。这款设备在功能上与 Google Home Hub 和亚马逊的 Echo Show 相似,但苹果的智能家居控制中心的独特之处可能是苹果 AI,包括 10 月下旬开始向用户推出的 Apple Intelligence 以及即将到来的 App Intents 系统,该系统可使用 AI 控制软件程序。此外,苹果还在开发一款带有机械臂的版本,能够移动平板设备。这表明苹果可能不仅仅是在开发一个智能设备控制面板,而是在寻求更先进的智能家居解决方案。🔗 https://www.bloomberg.com/news/articles/2024-11-12/apple-home-hub-detailed-apple-intelligence-homeos-square-ipad-like-design?srnd=undefined📱 Google 推出适用于 iOS 的 Gemini 应用Google 近日在全球范围内为 iOS 用户推出了 AI 助手 Gemini 的独立应用。此前,iOS 用户仅能通过 Google 应用或移动网络与 Gemini 互动。新应用支持 35 种语言的文本提示,以及 12 种语言的 Gemini Live 对话功能。Google 承诺还将增加更多语言支持。此外,应用新增了 Imagen 3 模型生成图像和扩展程序查询 Google 账户信息等功能。Gemini 应用旨在简化用户访问流程,建立肌肉记忆,并能便捷地连接其他 Google 应用。🔗 https://techcrunch.com/2024/11/14/google-launches-gemini-app-for-ios-worldwide/Hunt for Tools|先进工具🐧 腾讯元宝 2.0 版本更新腾讯元宝 2.0 版本,本周正式焕新上线。腾讯元宝支持对话列表焕新,可以更轻松地查找历史对话和使用过的智能体。此外,腾讯元宝精选 AI 搜索、AI 阅读、创意绘画、灵感图库、AI 美照五大应用,多维度满足搜、读、写、画创作需求。除微信公众号外,腾讯元宝还升级整合微信视频号、QQ 音乐等信息资源,提供更加智能、便捷的搜索服务,随时随地想搜就搜。基于新一代大模型「混元 turbo」,元宝性能大幅提升,训练和推理效率提升一倍。得益于国内首个自研 MoE 多模态大模型,其还支持任意长宽比及最高 7K 分辨率图片的理解分析;中文原生 DiT 文生图架构,语义理解、画面质感与真实性方面得到全面提升。🔗 https://mp.weixin.qq.com/s/9CfdKnDRfpqlfWaZs4rg9Q📗 腾讯发布 AI 智能工作台 ima11 月 15 日,腾讯正式发布 AI 智能工作台 ima.copilot(简称 ima)。据介绍,ima 搜索得出的答案,除开全网信源,还打通——微信公众号文章的生态,能为用户提供好答案和高质量的问题相关信息,有效提升信息获取效率。除了能搜出答案,ima 还有一个特点——边问边看,边搜边记。不止网络上的资料,本地上百页的文献,几十万字的行业经验,只需要把文件拉入到 ima 的对话框里,它便可以总结内容,提炼要点,生成脑图。ima 还是一款非常好用的编辑工具。搜到的答案,解读的资料,只需要选中你要的部分,就可以生成笔记,直接进行编辑。值得注意的是,ima 是由腾讯混元大模型提供技术支持。🔗 https://mp.weixin.qq.com/s/IVYdGePcu2Gw6Wm5fYygOA👏 Kimi 发布新推理模型Kimi 近期正式发布新一代数学推理模型 k0-math。基准测试显示,Kimi k0-math 的数学能力可对标全球领先的 OpenAI o1 系列可公开使用的两个模型:o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中,k0-math 初代模型成绩超过 o1-mini 和 o1-preview 模型。 在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%。同时,Kimi 探索版也通过运用强化学习技术创新了搜索体验,在意图增强、信源分析和链式思考三大推理能力上实现突破。据悉,k0-math 模型和更强大的 Kimi 探索版,未来几周将会分批陆续上线。🔗 https://mp.weixin.qq.com/s/OCn6fgkccaRypT1TeLYBMg🎥 即梦 AI 视频生成模型更新11 月 15 日,即梦 AI 两大视频模型正式全量上线。据悉,S2.0 Pro 在 i2v 场景下有非常好的首帧一致性,可以保持与用户输入图的一致性、色彩等细节还原,在视频生成体验上更惊喜、更可控。P2.0 Pro 拥有极高的提示词遵循能力,对复杂的提示词能够保持严格的遵循。此外,P2.0 Pro 还能够在一句提示词内,实现多个镜头切换及多镜头组合,同时保持视频内形象主体、风格和氛围的一致性,让视频讲述更加丰富和完整的故事。🔗 https://mp.weixin.qq.com/s/FESYMwIkL\_leYVyw019Xuw🔨 文心 iRAG 和无代码「秒哒」发布百度本周发布两大 AI 技术——检索增强的文生图技术(iRAG)和无代码工具「秒哒」。文心 iRAG 用于解决大模型在图片生成上的幻觉问题,通过将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片:「整体效果远远超过文生图原生系统,去除了机器味儿。」「秒哒」具备无代码编程、多智能体协作和多工具调用三大特性,李彦宏宣称让每个人都拥有程序员的能力,不用写代码就能实现任意想法。在 AI 应用的发展趋势上,李彦宏表示,智能体是 AI 应用的最主流形态,即将迎来爆发点。🔗 https://mp.weixin.qq.com/s/i5XBGZ-gUGnX4tuW2Mbt8g📀 生数科技 Vidu 大模型迎来新版本11 月 13 日,生数科技官方公众号宣布,Vidu 大模型迎来 1.5 版本。官方表示,Vidu 的技术突破主要在以下三个方面: 复杂主体的精准控制:无论是细节丰富的角色,还是复杂的物体,Vidu 都能保证其在多个不同视角下的一致性。 人物面部特征和动态表情的自然一致:在人物特写镜头中,Vidu 能够自然且流畅地保持人物面部特征和表情的连贯性,避免了面部僵硬或失真的现象。 多主体一致性:Vidu 允许用户上传多个主体图像,包括人物角色、道具物体、环境背景等,并在视频生成中实现这些元素的交互。官方表示,Vidu 1.5 的推出,揭示了一个重要现象:视觉模型与语言模型一样,经过充分的训练,模型能够展现出对上下文的深刻理解、记忆等能力。具体实测细节欢迎回看 APPSO 此前文章👇给马斯克上了瑞士卷大考后,我终于拿捏这个国产 AI 视频模型的最强新功能 🔗 https://mp.weixin.qq.com/s/Hsuxys06l-ADoEa0NRbNGQ💻 Windows 版 ChatGPT 人人可用了OpenAI 宣布为微软 Windows 10 和 11 用户全量推出桌面版 ChatGPT 应用。Windows 版 ChatGPT 保留了网络版的大部分功能,包括 ChatGPT 搜索和高级语音模式,但这些高级功能仅对付费用户开放。该桌面版应用还能通过快捷键「Alt + 空格」快速调用,并支持文件、照片或截图的上传和聊天问答。另外,Mac 版 ChatGPT 也迎来一波大更新。Plus 用户现已能够与一系列编程工具无缝协作,比如 VS Code 和 Xcode。简单来说,开发者无需再将代码在不同应用间复制粘贴。启用新功能后,ChatGPT 客户端会自动读取开发工具中的代码。不过,ChatGPT 目前还不能在你的代码编辑器中自动创建或修改代码文件。🔗 https://techcrunch.com/2024/11/14/chatgpt-can-now-read-some-of-your-macs-desktop-apps/Hunt for Fun|先行🎮 浏览器变身虚拟办公室,WorkAdventure 让你的会议活起来WorkAdventure 是一个基于浏览器的虚拟办公平台。它通过像素风格的 2D 图形创建一个可交互的在线办公环境,模拟现实中的办公室布局,用户可以通过浏览器访问,无需安装任何软件,即可快速创建和管理自己的虚拟办公室,进行团队协作和互动。用户都可以为团队创建和设计个性化的办公室环境。每个团队成员都有一个虚拟角色,可以在虚拟空间内自由移动、与其他成员互动、开设私人对话。WorkAdventure 还集成了语音和视频通话功能。语音聊天是基于位置的,即你越接近其他成员,你的语音音量越大,真实模拟了现实中的沟通感受。用户可以进行私聊、组建小组或使用公共频道。WorkAdventure 集成了常见的视频会议工具(如 Google Meet、Zoom 等),能够直接启动会议,并支持分享文件、演示内容以及其他资源。附上体验地址: https://play.staging.workadventu.re/@/tcm/workadventure/wa-village🔗 https://x.com/seclink/status/1856325191741374519Hunt for Insight|先知👀 OpenAI 产品负责人:现在的模型受限于评估方法OpenAI 的首席产品官 Kevin Weil 和 Anthropic 的首席产品官 Mike Krieger 共同探讨了 AI 领域的多个核心议题。他们讨论了当前 AI 模型的局限性,强调这些局限更多地在于评估方法而非智能水平本身,指出产品经理的角色正在经历转变,从传统的角色向研究型产品经理演进,这要求他们掌握编写评估标准和模型微调等新技能。两位产品负责人还展望了 AI 的未来。他们提出认为「主动性」和「延时响应」将作为 AI 发展的关键词,预测模型将变得更加主动,监控用户邮件、发现趋势、准备会议内容,同时也会更「异步」,可能需要时间来思考和回答。此外,他们还对用户适应 AI 的速度表示惊叹,预计 AI 将模仿人类思维,以指数级速度迭代升级,并以我们人类互动的所有方式进行互动,预示着全新的人机交互范式。🔗 https://www.youtube.com/watch?v=IxkvVZua28k🫀 Anthropic 创始人:Scaling Laws 在人类水平以下无上限Anthropic 创始人兼 CEO Dario Amodei 近期与播客主持人 Lex Fridman 进行了深入访谈,内容涵盖多个方面。作为 OpenAI 的前高管,谈及离开的原因时,Amodei 表示,离开并非是因为不喜欢与微软的协议,而是希望带着信任的人去实现自己的愿景。Amodei 更关注负责任地发展 AI,如在早期他就很喜欢向行业公开分享结果。他还认为 Scaling Laws 在人类水平以下无上限,不同领域的上限可能不同。在生物学等领域,AI 有很大空间变得更聪明;而在某些领域可能接近人类水平。未来只有在构建系统时才能确定上限,可能的限制包括数据耗尽、计算受限或需要新架构等。谈及 Claude 模型命名方式混乱时,这位 Anthropic 的创始人解释说,不同大小的模型需要不同的训练时间,根据模型发布的时间的前后不同,命名也会有所变化。「我认为我们做得非常好。我们有 Haiku、Sonnet 和 Opus ,在命名方面处于有利地位。我们正在努力保持这种状态,但它并不完美,所以我们会尝试回归简单。但就这个领域的性质而言,我觉得没有人能找到完美命名方法。」🔗 https://www.youtube.com/watch?v=ugvHCXCOmm4🤯 月之暗面创始人杨植麟最新回应月之暗面创始人杨植麟最近在媒体交流中回应了一连串问题。关于 AI 创业公司被收购和人才流失的问题,他表示他的公司没有遇到人才流失,并且认为行业整合是必然趋势。他强调公司始终保持小规模和高效率,专注于核心业务,避免团队扩张对创新的负面影响。他提到,今年二三月份开始聚焦于 Kimi 产品,减少产品线,以提升留存作为核心任务,并认为留存的提升与技术成熟度正相关。对于深层推理和数学模型,他认为这些技术在教育产品中有价值,并能应用于更多场景。关于多模态能力,他表示公司正在内测,认为 AI 的未来在于思考和交互能力,其中思考能力更为关键。在竞争方面,他更关注为用户提供价值,而不是竞争本身,并强调提升模型的思考推理能力。他认为 ChatGPT 已经接近一个超级应用,对于大模型预训练的瓶颈,他持乐观态度,认为预训练还有空间,强化学习将是未来重点。🔗 https://mp.weixin.qq.com/s/OCn6fgkccaRypT1TeLYBMg彩蛋时间🐱《全军出击》
作者:@asdcake0206_38683工具:Midjourney v6.1Pormopt:Cute little girl general riding a giant white cat, ancient China, battle scene, full body shot, movie stills, highly realistic.链接:https://www.midjourney.com/jobs/8667fe78-deca-496a-8c94-40d2509686eb?index=0