大平台动作
2024年诺贝尔物理学奖揭晓,人工智能先驱Hopfield和Hinton获奖
特斯拉无人驾驶出租车亮相!马斯克公布Optimus最新进展
AMD推出MI325X AI芯片系列,与英伟达Blackwell正面交锋
科大讯飞:将于10月24日发布多模态视觉交互技术
vivo发布全新蓝心大模型矩阵,并推出蓝心3B端侧模型
快手北大推超高清视频生成模型Pyramid-Flow,1分钟生成5秒视频
新力量崛起
超强推理能力!Kimi探索版开启内测:解决复杂搜索问题
智谱AI搜索重磅升级:思维链+深度阅读,开启信息检索新纪元
初创公司Writer使用合成数据降低人工智能模型训练成本
投融资风向
吴恩达领导的AI Fund投资印度人工智能医疗保健公司Jivi
01
2024年诺贝尔物理学奖揭晓,人工智能先驱Hopfield和Hinton获奖
大平台动作
瑞典皇家科学院8日宣布,将2024年诺贝尔物理学奖授予约翰·霍普菲尔德(John J. Hopfield)和杰弗里·辛顿(Geoffrey E. Hinton),以表彰他们“通过人工神经网络实现机器学习的基础性发现和发明”。
据诺贝尔奖官网消息,评奖委员会在当天发布的新闻通报中指出,两名获奖者使用物理学工具来开发训练人工神经网络的方法,这些方法是当今强大的机器学习的基础。
约翰·霍普菲尔德创造了一种关联记忆,它能够存储和重构图像以及其他模式类型。杰弗里·辛顿发明了一种能够自主发现数据中属性的方法,并执行任务,如识别图像中的特定元素。辛顿将霍普菲尔德网络的想法应用于一种新网络,这种新网络使用另一种方法:玻尔兹曼机。玻尔兹曼机可以学习给定数据类型的特征元素,可以用来分类图像或创建新材料。
诺贝尔物理学奖委员会主席艾伦·穆恩斯(Ellen Moons)表示,“获奖者的工作已经产生巨大效益。在物理学中,人工神经网络应用广泛,比如开发具有特定性能的新材料。”
新闻拓展:
02
特斯拉无人驾驶出租车亮相!马斯克公布Optimus最新进展
大平台动作
10月11日上午,特斯拉召开特斯拉“WE,ROBOT”(我们,机器人)发布会,推出名为CyberCab的无人驾驶出租车和无人驾驶Model Y。
特斯拉CEO埃隆·马斯克在活动现场介绍,特斯拉Robotaxi命名为Cybercab,没有方向盘也没有踏板。预计Cybercab的成本将低于3万美元。他还表示:“2026年或2027年之前,我们会以非常高的产量生产Cybercab。”
值得注意的是,马斯克宣布推出Robovan(无人驾驶厢式货车),一次能装载最多20人。马斯克介绍,Robovan可以大幅降低出行成本,每英里大概是5到10美分。
此外,马斯克在Robotaxi发布会上表示,在Optimus机器人方面取得了很大进展,按规模生产的Optimus机器人成本将在2万美元至3万美元之间。马斯克曾许诺,Optimus 将会对人类文明产生 “根本性的转变”,并预计其会带来 “两个数量级” 的经济产出提升,最终可以大规模生产,甚至达到数百万台的数量。他相信,Optimus 的出现将会帮助实现 “一个没有贫困的未来”。
新闻拓展:
https://mp.weixin.qq.com/s/6mKOBix33SH_RwooslZJ-Q
03
AMD推出MI325X AI芯片系列,与英伟达Blackwell正面交锋
大平台动作
当地时间10月10日,在旧金山举行的Advancing AI 2024大会上,AMD推出Instinct MI325X AI加速器(以下简称MI325X),直接与英伟达的Blackwell芯片正面交锋。
现场展示的数据显示,与英伟达H200的集成平台H200 HGX对比,MI325X平台提供1.8倍的内存量、1.3倍的内存带宽和1.3倍的算力水平。AMD表示,这款AI芯片预计在2024年第四季度正式投产,2025年一季度开始向客户交付。
AMD还在会上公布了最新的AI芯片路线图,采用该公司CDNA 4架构的MI350系列明年上市,MI400系列将采用更先进的CDNA架构。
AMD首席执行官苏姿丰(Lisa Su)表示,到2028年,数据中心、AI和加速器市场预计将增长至5000亿美元。她认为,生成式AI在其中起到关键作用,为支持AI训练和推理,需要大量投资新的基础设施。而在这样的前提下,未来四年内市场将以每年70%以上的速度增长。
新闻拓展:
https://mp.weixin.qq.com/s/glLHm6f__IEESiM-lWBgnQ
04
科大讯飞:将于10月24日发布多模态视觉交互技术
大平台动作
10月10日,科大讯飞宣布,2024科大讯飞全球1024开发者节将于10月24日开幕。
官方表示,届时将发布讯飞星火大模型升级版,其底座能力将再次升级,包含数学、代码和长文本能力显著提升、中英文综合能力持续领先,训练推理效率大幅提升等特性。
在今年的1024开发者节活动中,科大讯飞还将首次发布多模态视觉交互及超拟人虚拟人交互能力,官方称将面向万物智联“打造极致人机交互体验”。此外,还将在教育、医疗、科研、司法、政务等领域升级行业大模型及更多应用产品。
在去年的2023科大讯飞全球1024开发者节期间,科大讯飞发布了讯飞星火3.0大模型。
科大讯飞2024年上半年营收93.25亿元,同比增长18.91%,净亏损4.01亿元,去年同期盈利7357万元,同比转亏-644.59%。
新闻拓展:
05
vivo发布全新蓝心大模型矩阵,并推出蓝心3B端侧模型
大平台动作
10月10日,在2024年vivo开发者大会的开幕演讲中,vivo正式发布了自研的全新蓝心大模型矩阵,不仅升级语言大模型和端侧大模型能力,其自研的语音大模型、图像大模型以及多模态大模型也首次亮相。
vivo推出了全新的30亿参数蓝心端侧大模型3B,据称在对话写作、摘要总结、信息抽取等能力上,该模型能够与行业内7B至9B参数的大模型相媲美。与之前的蓝心7B模型相比,新的蓝心3B在性能上提升了300%,同时在平衡模式下功耗优化了46%,内存占用减少了63%,实现了每秒钟80字的极致出词速度,系统功耗仅为450mA,内存占用仅为1.4GB。
vivo还推出全新的自研蓝心语音大模型,该模型能够准确理解自然语义,模拟人声并表达情感,同时支持同声传译功能。
此外,vivo还升级了蓝心图像和多模态大模型。蓝心图像大模型将强化中国特色和东方美学的融合生成能力,官方称其为国内最懂中文语境的图像模型之一,支持国风水墨风格,并能在图片生成过程中增加汉字创作。蓝心多模态大模型则升级了视觉感知和理解能力,能够对手机屏幕进行更深度的理解,并在视频流的实时对话中提供更流畅自然的体验。
新闻拓展:
https://www.vivo.com.cn/brand/news/detail?id=1271&type=0
06
北大快手推超高清视频生成模型Pyramid-Flow,1分钟生成5秒视频
大平台动作
据VentureBeat报道,北京大学、北京邮电大学和快手科技在本周联合开源了一款名为Pyramid Flow的高清视频生成模型。Pyramid Flow能根据文本描述制作长达10秒、分辨率为1280×768、每秒24帧的视频。
Pyramid Flow采用了金字塔流匹配算法,优化了视频生成的效率和质量。这一算法将视频生成过程分解为多个阶段,每个阶段对应着不同的分辨率。
在推理阶段,Pyramid Flow模型能够以相当快的速度生成视频。具体来说,它可以在56秒内生成一段时长为5秒、分辨率为384p的视频,这一速度与市面上许多全序列扩散模型相当,甚至更快。
目前,该项目已经在Hugging Face和GitHub上开源。
新闻拓展:
07
超强推理能力!Kimi探索版发布,10倍搜索量自主解决复杂问题
新力量崛起
10月11日,AGI创业公司月之暗面正式发布可自主海量搜索解决复杂问题的Kimi探索版。Kimi 探索版具备AI自主搜索能力,可以模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,提供更全面和准确的答案,帮助用户更高效地完成分析调研等复杂任务。
Kimi探索版的搜索量是普通版的10倍,一次搜索即可精读超过500个页面。在内部性能评估测试中,Kimi的性能评估团队结合1000多个来自用户的真实长难问题,对比了国内外所有的主流AI助手和搜索类产品,包括付费和专业版本,Kimi探索版的回答准确性和完整性具备全面优势,综合性能超过同类产品至少30%。
“如果Kimi搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到。未来搜索引擎会成为AI更擅长调用的工具,人只需要专注于提出好的问题,AI就可以结合模型本身的能力在庞大的互联网中自主海量搜索,不断反思迭代,更精准地定位所需答案。”Kimi探索版产品负责人表示。
据了解,Kimi探索版已逐步分批上线Web端(kimi.ai),预计下周一前至全量用户。收到更新的用户,只需打开对话框左下角的「探索版」开关,或者直接在对话框中输入斜杠“ / ”,就可以唤醒 Kimi探索版,让Kimi与你一起探索更复杂问题的答案。
为了确保更多人可以用起来,Kimi探索版目前每人每天可以使用5次。据了解,除了网页版之外,Kimi智能助手的手机APP后续也将上线该功能。
新闻拓展:
https://mp.weixin.qq.com/s/PkTscjn37YbCsuTGEkKHCg
08
智谱AI搜索重磅升级:思维链+深度阅读,开启信息检索新纪元
新力量崛起
近日,智谱科技推出了一款基于思维链的全新AI搜索工具,通过结合推理能力和长文本阅读,有效解决了此前AI搜索常见的"幻觉"问题。更重要的是,它能对搜索结果进行复杂的总结,为用户提供更深入、更准确的信息,大大节省了整理和逻辑推理的时间成本。
其主要特点包括:
单次可阅读超过100个网页,信息获取能力大幅提升。
支持多级推理的思维链,复杂问题解答更加全面。
与智谱其他AI工具联动,功能更加丰富多样。
在实际应用中,该工具展现出了令人惊叹的能力。例如,用户可以在复杂内容的基础上增加需要计算的问题,工具不仅能给出准确答案,还能详细解释计算过程。当被要求分析A股历史牛市时,它不仅能深入阅读网页信息并给出对应的表格,还可以使用Python绘制相关图表,为用户提供直观的数据可视化结果。
新闻拓展:
https://mp.weixin.qq.com/s/RDpYNK3VTUsKYxh47DCcsQ
09
初创公司Writer使用合成数据降低人工智能模型训练成本
新力量崛起
据CNBC报道,旧金山的人工智能初创公司Writer周三推出了一款大型人工智能模型,与OpenAI、Anthropic等公司提供的企业产品展开竞争。令人瞩目的是,Writer只需花费约70万美元来训练其最新模型,包括数据和GPU,而竞争对手的初创公司则花费了数百万美元来构建自己的模型。
Writer使用合成数据(即人工智能创建的数据)来降低成本。它旨在模拟通常输入模型的真实世界信息,而不会损害隐私,并且正在成为一种更受欢迎的训练方法。亚马逊、Meta和微软等公司已经开始使用合成数据来训练他们的模型。
然而,一些专家警告称,应谨慎使用合成数据,因为它可能会降低模型性能并加剧现有的偏见。Writer联合创始人兼首席技术官Waseem Alshikh表示,Writer多年来一直致力于合成数据管道的研发,并强调他们不会在虚假或幻觉数据上训练模型,而是采用真实的事实数据,并将其转换为更清晰、更干净的合成数据用于模型训练。
Writer的生成式人工智能让企业客户能够使用其大型语言模型(LLM)为LinkedIn帖子、职位描述、使命宣言等任何内容生成听起来像人类的文本,分析和总结数据或文本,并构建用于市场分析等的定制人工智能应用程序。该公司拥有250多家企业客户,包括埃森哲、优步、Salesforce、欧莱雅和先锋集团,他们在支持、IT、运营、销售和营销等领域使用该技术。
新闻拓展:
https://baijiahao.baidu.com/s?id=1812481384554466986&wfr=spider&for=pc
10
吴恩达领导的AI Fund投资印度人工智能医疗保健公司Jivi
投融资风向
10月8日,据路透社消息,计算机科学家吴恩达(Andrew Ng)领导的人工智能基金AI Fund于本周二宣布,已对印度的一家人工智能医疗保健公司Jivi进行投资。
据Nasscom-BCG今年早些时候发布的报告,印度的人工智能领域正蓬勃发展,预计到2027年,其市场规模将增长一倍以上,达到220亿美元。其中,产品和初创企业类别预计将占据15-17%的市场份额,与金融服务并列最高。
Jivi总部位于印度北部城市古尔冈,该公司利用人工智能技术提供潜在的诊断和治疗方法,生成健康报告,并执行管理任务。AI Fund在一份声明中介绍了Jivi的相关情况,但并未透露具体投资金额或所购股份比例。
此外,AI Fund还在红杉资本和软银集团的支持下,投资了播客制作平台Podcastle和投资研究应用程序Octagon AI。
吴恩达作为AI Fund的执行合伙人,于今年4月加入了亚马逊董事会。在此之前,他曾领导Alphabet旗下谷歌和中国互联网搜索引擎百度的AI项目,并随后从这两家公司离职。
新闻拓展:
https://www.reuters.com/technology/artificial-intelligence/andrew-ngs-fund-makes-first-india-investment-with-ai-healthcare-firm-jivi-2024-10-08/
信息来源:WAIC综合整理