AI新闻早报|月之暗面发布Kimi新数学模型k0-math,多项指标超O1

文摘   2024-11-18 07:57   浙江  

👇关注公众号后设🌟标,掌握第一手AI新动态

早报搜集过往24小时全球AI新闻动态,周一至周六发送,内容的分类和摘要由AI Agent自动完成

封面图由AI生成

2024-11-18 全球AI新闻早报

今日热点

  • 月之暗面创始人杨植麟发布Kimi新数学模型k0-math,并分享AI发展方向思考:月之暗面旗下AI助手Kimi的月活用户已达3600万,近日其创始人杨植麟发布了新的数学模型k0-math,该模型在多个数学基准测试中超越了OpenAI的o1系列,展现了强大的推理能力,未来将应用于教育和提升Kimi搜索功能。杨植麟认为AI的下一个重要方向是增强思考能力,并强调强化学习和高效团队运作的重要性,同时月之暗面也在探索多模态产品,但更关注思考能力而非交互方式。IT之家,第一财经,量子位

产品发布

  • 百度世界大会发布iRAG技术,专注解决AI幻觉问题,而非追逐视频生成技术Sora: 百度在世界大会上发布了iRAG图像检索增强生成技术,旨在解决AI图像生成中的“幻觉”问题,提升生成质量和真实性。李彦宏表示,百度不与Sora等视频生成技术竞争,而是专注于通过iRAG解决AI幻觉问题,发展数字人等多模态应用,最终推动AI技术落地,加速AGI发展。百度认为,模型应用落地才是关键,并将持续提供AI技术基础设施。36氪,量子位
  • AMD加码AI芯片市场竞争: AMD正积极抢占AI芯片市场份额,其数据中心业务营收倍增,显示AI硬件需求旺盛。AMD计划第四季度量产全新AI芯片MI325X,并推出性能提升三倍的Versal Gen 2自适应SoC,以应对Nvidia等竞争对手的挑战。这反映了全球对高性能AI芯片及数字化转型的迫切需求,预示着AI芯片市场竞争将日益白热化。TechnologyMagazine
  • AI图像生成和信息获取工具升级:谷歌将基于Gemini的AI图像生成功能整合进Google Docs,方便用户创建文档图片;AI初创公司Perplexity推出基于美联社数据的选举信息中心;Runway升级Gen-3 Alpha Turbo,增强AI视频生成控制;ChatGPT发布了第二个搜索功能“ChatGPT Search”,提升信息获取效率。这些更新标志着AI在图像生成、信息获取和内容创作领域取得新的进展,进一步提升用户体验。Digital Trends
  • Mistral发布多模态大模型预告:人工智能公司Mistral预告即将发布两个大型多模态模型:Mistral Large 3和Pixtral Large,目前仅通过API提供访问。其中,Pixtral Large 2411是继9月发布的Pixtral 12B后的升级版,展现强大的多模态能力。此举正值AI开源生态系统竞争日益激烈之际,Mistral估值60亿美元,将与GPT-4o和Llama 3等顶级模型竞争,其新模型有望在这一领域扮演重要角色。Mistral此前已发布Mistral 3B小型语言模型。Analytics India Tech
  • Go语言迎来15周年,并宣布一系列性能提升计划:Go语言团队为庆祝其15周年纪念日,宣布了一系列旨在提升Go语言性能的改进计划,包括针对大型多核处理器、高级指令集和非统一内存层次结构的优化,以及对AI工作负载性能的提升。Go 1.24版本将引入更高效的映射实现和新的垃圾收集算法。为了更好地支持AI开发,Go已集成到流行的AI SDK中,并强化了标准库的安全性。Go语言的流行度也持续增长,在Tiobe排名中位列第七,创下历史新高。这些改进将巩固Go语言在高性能计算和AI领域的竞争力。The InfoWorld

技术创新

  • 多智能体系统NEO自动化机器学习工作流程:一款名为NEO的多智能体系统问世,它能够自动化整个机器学习工作流程,包括数据预处理、特征提取、模型选择和部署等环节。在50场Kaggle竞赛中,NEO取得了26%的成功率,超越了此前最先进的系统。NEO的出现有望大幅提升机器学习工程师的工作效率,降低进入门槛,并推动机器学习领域的技术进步,但其真实效能仍需进一步验证。Marktechpost,机器之心
  • LeCun团队研发出基于视觉特征的世界模型DINO-WM,实现零样本规划: 图灵奖得主Yann LeCun团队发布了新型世界模型DINO-WM,该模型利用预训练的视觉特征,能够在复杂环境中进行零样本规划,并在未见过的新环境中保持良好的泛化能力。DINO-WM在物理合理性和目标状态准确性方面优于现有生成式视频模型,为通用世界建模、推理和控制提供了重要进展,有望成为解决复杂环境控制任务的关键工具。这项研究挑战了当前流行的AI技术,强调了构建任务无关型世界模型的重要性。机器之心
  • 苹果推出新型机器学习方法CCE,大幅降低大型语言模型训练内存消耗: 苹果研究人员开发了一种名为Cut Cross-Entropy (CCE) 的新方法,有效解决了大型语言模型训练中交叉熵损失计算的高内存占用问题。例如,在Gemma 2模型中,CCE将内存消耗从24GB降低到1MB,显著提高了训练效率和批处理大小,同时保持了模型性能,为更大规模的机器学习模型训练提供了可能。该研究成果已公开发布。Marktechpost
  • 微软发布百万级合成指令数据集AgentInstruct-1M-v1,助力语言模型性能提升: 微软研究院发布了一个包含100万条合成指令-响应对的大型数据集AgentInstruct-1M-v1,该数据集通过处理公开网络文本自动生成,解决了高质量指令数据集获取难的问题。利用该数据集,微软优化了Mistral-7b模型,使其性能显著提升,并在多个基准测试中取得了优异成绩。此举降低了高质量指令调优数据获取门槛,推动了自然语言处理领域的发展,为研究人员和开发者提供了更便捷的工具。Marktechpost
  • 大型混合专家(MoE)模型发展迅速,涌现众多参数量巨大的新模型: 新闻报道了近期涌现的多个大型混合专家(MoE)模型,包括谷歌的Switch-C、X AI的Grok系列、Databricks的DBRX、Mistral AI的Mixtral、Snowflake的Arctic、AI21 Labs的Jamba以及腾讯的Hunyuan等,这些模型的参数量普遍超过数百亿,并在特定任务如长文本处理上展现出优异性能。MoE模型作为一种高效可扩展的AI解决方案,正逐渐成为人工智能领域的研究热点。DeepSeek V2.5目前在LMSYS排名中表现最佳,其他模型也在不断改进中,预示着MoE模型的未来发展潜力巨大。Marktechpost
  • 北大团队开发出无需训练的开放式目标检测和实例分割框架VL-SAM: 北京大学王选计算机研究所王勇涛团队研发出一种名为VL-SAM的新框架,该框架结合视觉语言大模型(VLM)和分割基础模型(SAM),无需额外训练即可实现开放式目标检测和实例分割。VL-SAM在长尾数据集LVIS和自动驾驶数据集CODA上均取得了优异成绩,展现出强大的泛化能力和应用前景,为解决深度学习模型在处理未见物体时的缺陷提供了新思路,有望提升自动驾驶等领域的安全性。机器之心

商业合作

  • 阿里影业与阿里巴巴通义技术合作加速AI在影视行业的应用:阿里影业与阿里巴巴旗下通义千问大模型展开深度合作,探索AI技术与影视制作全链路融合,共同研发应用AI技术提升影视制作效率和质量,涵盖剧本创作、拍摄制作、后期特效等多个环节,旨在推动中国影视行业的技术升级和产业变革。财经网

投资融资

  • Odyssey获1800万美元A轮融资,用背负式摄像头构建AI生成世界: 生成式AI初创公司Odyssey完成1800万美元A轮融资,总融资额达2700万美元。该公司由自动驾驶领域专家创立,采用独特的传感器背包采集现实世界数据,结合AI技术构建可编辑、照片级逼真的虚拟世界,旨在革新电影和游戏中的虚拟世界创建方式。(Maginative)

  • 中国医疗健康行业融资活跃,精准放疗技术升级:  医科达在进博会上展出新型精准放疗设备,提高治疗精准度,减少对正常组织的损伤,展现了中国医疗健康产业的技术创新能力。此外,莱芒生物、天鹜科技、摩漾生物等多家公司获得亿元级融资,分别用于免疫疗法、AI药物研发和再生医美材料等领域。南京英派药业和通瑞生物制药也获得巨额融资,用于肿瘤药物和放射性药物研发。( 36氪)

应用落地

  • 萨姆·奥特曼和阿里安娜·赫芬顿的Thrive AI Health公司遭遇滑铁卢: OpenAI CEO萨姆·奥特曼与媒体巨头阿里安娜·赫芬顿联手创办的Thrive AI Health公司,其主打AI健康产品Thrive AI Coach未能达到预期,功能与现有健康应用和睡眠追踪器相似,与其宣称的“革命性”变革相去甚远。这凸显了AI医疗应用落地面临的挑战,也与二人此前在《时代》杂志上发表的乐观预测形成强烈反差。Futurism
  • AI可提前预警锂电池起火: 美国国家标准与技术研究所(NIST)与西安科技大学合作,开发出一种基于机器学习的算法,能够通过识别锂离子电池在起火前因内部压力升高而发出的独特声音来预警火灾风险。研究人员利用38个爆炸电池的超过1000个音频样本训练该算法,测试结果显示其准确率高达94%,即使在噪音环境下也能保持高准确性。这项技术有望应用于各种场景,例如家庭、电动汽车停车场等,提升公共安全水平,为人员疏散争取宝贵时间。IT之家
  • 《财富》杂志AI播报员口音成河南话引发热议: 《财富》杂志官网新推出的AI语音播报功能,其中文播报意外带有浓厚的河南方言,引发网友热议和调侃。尽管《财富》杂志以权威财经报道闻名,此次AI语音播报的方言特色却意外成为焦点,增添了一丝趣味性,也突显了AI技术在实际应用中可能出现的“意料之外”的结果,以及大众对AI技术应用的关注。站长之家
  • Grok AI吐槽《汤姆指南》编辑桌面: 《汤姆指南》编辑们用X平台新推出的AI聊天机器人Grok测试其图像分析功能,让其评价他们的办公桌。Grok对每个编辑的工作环境给出了直率的评分和评论,例如有人键盘太花哨,有人桌面太乱。这次测试展现了Grok强大的图像分析能力和独特的个性化评价方式,也暗示了AI在未来家居设计方面的潜力。Toms Guide

新锐言论

  • 诺贝尔奖得主辛顿警告“杀人机器人”即将到来:  人工智能领域泰斗、新科诺贝尔奖得主杰弗里·辛顿近日在一部纪录片中发出警告,称科幻电影中不受监管的“杀人机器人”即将成为现实。他认为人工智能技术发展速度过快,潜在风险巨大,缺乏有效的监管措施。辛顿的警告引发了公众对人工智能伦理和安全问题的广泛担忧,并促使各界呼吁加强人工智能相关法律法规的建设,以防范潜在风险。澎湃

  • 披头士乐队AI歌曲获格莱美提名,引发AI行业发展与监管讨论: 披头士乐队使用AI技术制作的歌曲“Now and Then”获得格莱美奖项提名,成为首个获得该奖项提名的AI参与作品。这引发了人们对AI技术在音乐创作中的应用以及未来发展方向的关注,同时也引发了对AI行业发展和潜在风险的讨论。Fox

行业分析

  • 阿里巴巴Q2财报:净利润大涨但营收不及预期:阿里巴巴发布2025财年第二季度财报,归属于普通股股东的净利润同比增长63%,主要受益于股权投资计价和运营利润增加,但营收同比增长仅5%,低于预期。淘天集团收入小幅增长,但订单量和GMV实现双位数增长,4600万88VIP会员贡献近半数GMV。阿里云收入增长7%,AI相关产品收入连续五个季度实现三位数增长。公司回购41亿美元股份,并表示云业务和AI将持续推动未来增长。尽管自由现金流下降,但整体显示阿里巴巴在战略转型和成本控制方面初见成效。华尔街见闻,36氪,虎嗅
  • ChatGPT冲击在线教育巨头Chegg,导致其用户流失和股价暴跌: 在线教育公司Chegg受到ChatGPT等AI技术的巨大冲击,用户数量大幅减少,股价从近100美元跌至1.72美元,市值蒸发约145亿美元。Chegg的转型努力效果不佳,调查显示学生更倾向于使用ChatGPT学习,这预示着教育科技行业可能面临结构性变化。虎嗅
  • 微软AI巨额投资引发内部质疑: 微软正斥资数十亿美元开发Copilot等AI工具,但公司内部一些员工对这项巨额投资的实际效益和潜在风险表示担忧,认为回报难以保证。这反映出即使是科技巨头,在AI领域的巨额投资也面临着不确定性和内部的谨慎评估。Business Insider
  • AI概念股出门问问上市半年股价暴跌超七成,业绩亏损严重:  AI公司出门问问上市仅半年,股价已从发行价3.8港元跌至不足1港元,跌幅超过七成。尽管其AIGC解决方案收入增长迅速,但整体营收下滑37.9%,亏损扩大至5.79亿元,市场对其未来发展表示担忧。时代在线

政策法规

  • 特朗普回归或改变美国人工智能政策:美国前总统特朗普若再次当选,可能撤销现任政府规范人工智能发展和部署的行政命令,并计划设立由埃隆·马斯克领导的“政府效率部”。此举引发专家担忧,联邦层面或将缺乏AI监管,增加企业合规难度,但州级监管和AI创新预计仍将持续。专家建议组建多方参与的顾问小组,以平衡技术进步与安全伦理。 Newsweek

关注公众号后设🌟标,掌握第一手AI新动态


瓜哥AI新知
紧追AI业界一手观点、访谈、动态,点滴构建AI底层认知
 最新文章