现在是“无AI,不聊天”的状态。所有的话题都在基于AI展开……
上周,最热闹的莫过于云栖大会,伴随大会,各种与AI相关的产品和战略发布。比如,阿里云发布通义千问Qwen2.5,JetBrains 发布基于阿里云通义大模型的编程助手 JetBrains AI Assistant。
除此之外,还有亚马逊推出AI助手Amelia,字节跳动将发布豆包视频生成模型,而OpenAI的o1模型展现出更强大的推理能力。这些发布背后,微软联合贝莱德等计划筹资1000亿美元投资AI基础设施,同时聘请前GE CFO为新任运营主管,展现其对AI布局的重视。
头部企业动态
高通与英特尔接触,探讨可能的收购事宜
美东时间9月20日,CNBC证实高通近期接触英特尔探讨收购事宜。目前不清楚英特尔是否回应及收购条款。消息传出后,英特尔股价收盘涨约3%,高通股价收盘跌约3%。若交易达成,将成史上最大科技企业并购之一,英特尔市值超900亿美元。
英特尔曾是全球最大芯片制造商,但近年下滑,2024年加剧。8月公布令人失望财报后股价创50多年来最大单日跌幅,今年以来下跌53%。高通和英特尔在多个市场竞争,高通不自己生产芯片,靠台积电和三星等生产。周一,英特尔首席执行官帕特·基辛格向员工发备忘录,重申大力投资晶圆代工业务,未来五年或耗资1000亿美元,且考虑引入外部投资。英特尔错过人工智能热潮,多数先进人工智能程序在英伟达图形处理器上运行。高通收入低于英特尔,2023财年高通销售额358亿美元,英特尔542亿美元。潜在交易可能因反垄断和国家安全问题变复杂,双方在中国业务曾被中国反垄断执法机构阻止,该领域其他大型收购也多被搁置。
微软与贝莱德等组建集团,拟筹集 1000 亿美元投资 AI 基础设施
美东时间 9 月 16 日消息,微软和贝莱德等公司组成全球人工智能基础设施投资伙伴关系(GAIIP)。该集团计划合作筹集高达 1000 亿美元资金,用于开发人工智能数据中心及供电能源基础设施。成员包括正被贝莱德收购的基础设施投资者全球基础设施合作伙伴(GIP)以及阿联酋科技投资者 MGX。
微软首席执行官萨提亚·纳德拉表示,该倡议旨在聚集金融和行业领袖建设未来基础设施并以可持续方式提供动力。集团目标是筹集 300 亿美元初始资本,未来有望达 1000 亿美元,包括债务融资。科技公司竞相建设装满英伟达 GPU 的数据中心以运行生成式 AI 模型,但 GPU 消耗大量电力,需求飙升带来建设瓶颈。微软的投资独立于 Azure 公共云基础设施扩张支出,其为 OpenAI 等提供服务。今年 1 月贝莱德宣布收购 GIP,预计 10 月 1 日完成交易。
IBM 针对云服务部门秘密裁员涉及数千名员工
9月19日:据英媒 The Register 报道,一位 IBM 员工向该媒体透露,IBM 云服务部门 IBM cloud 过去数日经历了一次大规模裁员,影响数千名员工。
据悉,本次裁员是秘密进行的:受裁员工必须签署保密协议,不得对外谈论裁员具体细节。
本次裁员主要针对高级的程序、销售和支持人员,受影响的员工大多在50~55岁年龄段,工龄位于20~24年之间,职级集中在 L7、L8、L9,裁员前拥有相当高的薪资收入。
上个月,IBM彻底关闭了中国研发部门,涉及员工数量超过1000人。
IBM 本财年一季度的财报中提到了一笔4亿美元(约 28.36 亿元人民币)的裁员赔偿资金,按IBM在2023年以3亿美元的开支裁员3900人估算,本年度IBM将有约 5200名员工被裁,相当于整体员工的1.8%。
突发火灾!阿里云(新加坡节点)崩了
9 月 10 日,阿里云发布《新加坡可用区 C 网络访问异常》公告。
北京时间 2024 年 09 月 10 日 10:20,阿里云监控发现新加坡地域可用区 C 网络访问出现异常,部分云产品服务出现异常。
异常原因是新加坡机房发生火灾导致升温,消防人员已到达现场处置中,云网络大部分产品及云安全产品于 10:55 已完成主动切换,其他云产品服务仍在处理中。
微软聘请前GE CFO 担任新任运营主管
美东时间 9 月 12 日消息,微软周四告知员工,已聘请卡罗琳娜·迪贝克·哈佩(Carolina Dybeck Happe)担任执行副总裁兼首席运营官,向CEO萨提亚·纳德拉汇报工作。迪贝克·哈佩来自通用电气(GE),曾在 2020 年至 2023 年 9 月担任高级副总裁兼CFO。此次任命体现了微软在众多业务围绕人工智能展开时确保协调一致的努力。她将加入微软高级领导团队,与财务主管艾米·胡德、云和人工智能工程负责人斯科特·格思里等共事。
纳德拉表示,她将接管部分重要组织和团队,助力推动业务流程改进和公司人工智能转型。迪贝克·哈佩的任命在通用电气航空和能源业务在纽约证券交易所交易数月后做出。她曾在马士基和瑞典锁具公司亚萨合莱担任要职。自 2016 年前沃尔玛高管凯文·特纳离职后,微软一直没有运营主管。
昔日对手变盟友,甲骨文与亚马逊AWS达成战略合作
美东时间9月9日,甲骨文(Oracle)抛出一则重磅消息,其已搁置与AWS(亚马逊云科技)之间的长期分歧,与其昔日敌人结成“战略合作伙伴关系” ,并合作推出 Oracle Database@AWS云服务产品。
该产品允许客户在AWS平台,访问 Oracle Exadata数据库服务和位于专用基础设施上的Oracle自治数据库,可简化企业工作负载上云的迁移与部署,同时提高敏捷性、灵活性和安全性。
用户还可通过Oracle Database@AWS ,将存储于甲骨文数据库中的企业数据,无缝连接到在 AWS 云服务上运行的各类高级 AI / ML 应用程序。
甲骨文正在加速与云服务商的合作伙伴。除了AWS,甲骨文还与Microsoft Azure和Google Cloud建立了合作关系。
与此同时,甲骨文还发布了2025财年Q1财报,该季度营收133.07亿美元,同比增长6.86%;净利润29.29亿美元,同比增长21.03%。
MiniMax产品负责人离职,大模型初创企业人事变动频繁
牛透社9月14日消息:中国大模型独角兽MiniMax产品负责人张前川,因个人原因已淡出公司事务,改任产品顾问一职(已不参与MiniMax业务)。对上述消息,MiniMax回应:确认属实,我们很感谢前川的付出和努力。
一名知情者表示,产品顾问其实是虚职,张前川已经不参与MiniMax业务,与离职无异。
张前川此前在 MiniMax 内负责“星野”和“海螺”两款公司主力产品。张前川离职后,MiniMax 暂未透露产品新的负责人。
此前,不少大佬从互联网大厂加入大模型初创公司,不过2024年以来,大模型独角兽的不少核心成员,都选择了出走创业,或者加入新的团队。
今年6月,清华系大模型创业公司“衔远科技”传出人事变动,创始人、前京东AI掌门人周伯文已经不再主持公司事务。有知情人士还向媒体透露,除了周伯文,衔远科技多位业务负责人在今年春节前后均已离职。
今年8月,零一万物算法副总裁、模型预训练负责人黄文灏加入了字节跳动。近日,零一万物联合创始人李先刚也被曝出已离职,并回到曾就职的房屋交易平台贝壳。
资本市场动态
「极峰科技」完成1000万人民币天使轮融资,由清新资本投资
牛透社 9 月 19 日消息,极峰智能科技(南通)有限公司完成了天使轮千万级人民币融资,投资方为清新资本。该公司创立于 2023 年 7 月,是一家专注于工业垂类 AI 大模型开发的科技创新型企业。
极峰科技自主研发了“geegobyte 多模态信息融合大模型”“geegobyte 时序预测大模型”及“geegobyte 优化决策大模型”,能应对多种领域多个行业客户生产经营优化场景中的痛点需求。截至 2024 年 9 月,这三种大模型已在多个垂直领域有了基线版本的落地,并在持续迭代。其智能体平台产品也进入了最后的研发冲刺阶段。
极峰科技表示将继续深耕研发和产品创新,在积累一定量的标杆案例和落地经验基础上,打造面向垂类场景的开源基础大模型。同时通过技术合作、参与行业标准制定,构建产业联盟,形成具备影响力的行业生态。
Sapient Intelligence完成数千万美元种子轮融资,要创造有自主学习和思考能力的“智人”
牛透社 9 月 20 日消息,近日,Sapient Intelligence(以下简称“Sapient”)完成数千万美元的种子轮融资,本轮融资由新加坡Temasek Holdings backed Vertex Ventures领投,日本最大风投集团、欧洲及美国的头部VC们联合投资,本轮融资将主要用于算力支出及全球人才招募,Minerva Capital担任长期独家财务顾问。
Sapient通过模仿人脑思考的方式,训练AI的思考能力。核心团队由多名来自Deepmind、Google、Microsoft、Anthropic的研究员们组成。目前Sapient的基础架构已经完成数学验证,这是一个少见的,拥有多步计算、Memory和树搜索能力的非自回归模型。以人们对AGI的期待,目前或许也只有人类自己能满足其标准。因此让大模型向人脑的方向迭代,就是Sapient试图进化的方向。
未来,Sapient将主要部署在海外市场,尤其是美国、新加坡及日本。选择美国的原因无需赘述。同样,新加坡及日本也具备充分的数字化基础,围绕一个非西方社会文化的模型训练数据,可能会成为下一次技术突破的催化剂。
中昊芯英完成2.5亿人民币战略投资,投资方为艾布鲁
9 月 13 日,艾布鲁公告称,其控股子公司杭州星罗中昊科技有限公司拟以自有资金出资 2.50 亿元对中昊芯英(杭州)科技有限公司进行增资。其中 86.7011 万元计入注册资本,剩余部分计入资本公积。本次交易完成后,星罗中昊将直接持有中昊芯英 7.6923% 股权。
中昊芯英成立于 2020 年 10 月 28 日。该公司主要从事应用于各类云服务器、数据中心等人工智能核心芯片的研发、设计和销售。其主要产品为支撑超大规模人工智能模型训练的高性能人工智能芯片与计算集群,打造完整的软硬件一体化方案。公司自主研发的高性能 TPU 人工智能训练芯片 “刹那 ®” 在处理大规模 AI 模型训练和推理任务时表现出色,算力性能达到国内顶尖、国际领先水平。
AI 芯片设计公司「知合计算」再获数亿元融资,源码资本领投
牛透社9月9日消息:近日,国内基于RISC-V架构的 AI 芯片设计公司“知合计算”,宣布完成数亿元A1轮融资。本轮融资由源码资本领投,领航新界、云九资本、乐朴投资、厚雪资本、临港新片区科创基金(由临港科创投担任管理人)等投资方跟投。
知合计算成立于2022年10月,致力于针对 AI 智算场景开发基于RISC-V架构的高性能、可扩展计算芯片。本轮募集的资金将主要用于加速产品研发、推动产品商业化落地以及进一步加强人才团队建设。知合计算首款基于RISC-V架构的 AI 计算芯片产品有望于2025年推出。
据了解,此前,知合计算已完成数亿元人民币规模的天使轮及Pre-A轮融资,投资方包括华登科技、鼎晖VGC(创新与成长基金)、联新资本、临港科创投、浙大联创、沃丰实业、中益仁资本等。
江苏工厂系统提供商「虎虎科技」冲击美股上市!
牛透社9月11日消息:近日,一家来自江苏的工厂系统提供商“虎虎科技”向美国证券交易委员会(SEC)提交招股书修订稿。该公司最初于2023年3月提交申请,但未达到5000万美元的最低市值要求。
根据最新招股说明书,公司本次拟发行普通股125万股,本次发行后公司总股本为2125万股。发行价格为5美元/股,预计募资625万美元;股票代码为HUHU。
虎虎科技成立于2010年,主要为工业客户提供工厂设施管理和监控系统,包括高纯度工艺系统(HPS)和工厂管理控制系统(FMCS)。目前,产品和服务广泛应用于半导体制造商、LED和微电子工厂以及一些制药、食品和饮料制造商,其中超过98%的业务集中在半导体领域。
2022年和2023年,公司的总营收分别为1137.43万美元、1673.27万美元;同期净利润分别为93万美元、233.36万美元;毛利率分别为31.2%和32.3%,相对稳定。
中国 AI 芯片独角兽「壁仞科技」启动 IPO 上市辅导,估值达155亿
牛透社9月12日消息:近日,中国 AI算力芯片独角兽“壁仞科技”启动科创板IPO上市辅导,辅导机构为国泰君安证券股份有限公司,辅导签署时间是2024年9月10日。时间正值它被美国商务部列入“实体清单”近一周年之际。
壁仞科技成立于2019年,聚焦云端通用智能计算,逐步在 AI 训练、推理等多个领域提供解决方案,实现国产高端通用智能计算芯片突破。
2022年8月9日,壁仞科技发布首款基于自主原创架构的通用GPU芯片BR100,标志着中国企业第一次打破了此前一直由国际巨头保持的通用GPU全球算力纪录。
壁仞科技目前已完成多轮融资,公开融资总额超过50亿元人民币,投资方包括启明创投、IDG资本、华登中国,平安集团、高瓴创投、格力创投、松禾资本、云晖资本、国盛资本、招商局资本等机构。
根据胡润百富独角兽排行榜显示,壁仞科技估值达155亿元(约合21.77亿美元),一旦上市有望超过155亿。
值得一提的是,2023年10月17日,壁仞科技和摩尔线程等13家GPU实体被列入美国商务部下属的工业与安全局(BIS)“实体清单”。
产品发布
阿里云发布通义千问新一代开源模型 Qwen2.5
9月19日,阿里云 CTO 周靖人发布了通义千问新一代开源模型 Qwen2.5。其中旗舰模型 Qwen2.5-72B 号称性能超越 Llama405B。其性能优势主要体现在以下方面:
整体性能提升:相比 Qwen2,Qwen2.5 全系列模型在 18t tokens 数据上进行预训练,整体性能提升 18%以上,拥有更多的知识、更强的编程和数学能力。
基准测评得分高:Qwen2.5-72B 模型在 mmlu-rudex(考察通用知识)、mbpp(考察代码能力)和 math(考察数学能力)等基准测评的得分较高,分别达到 86.8、88.2、83.1。
指令跟随出色:其指令跟随版本 Qwen2.5-72B-instruct 在 mmlu-redux、math、mbpp、livecodebench、arena-hard、alignbench、mt-bench、multipl-e 等权威测评中表现出色,在多个核心任务上,以不到 1/5 的参数超越了拥有 4050 亿巨量参数的 Llama3.1-405B,继续稳居“全球最强开源大模型”的位置。
此外,Qwen2.5 还支持高达 128k 的上下文长度,可生成最多 8k 内容,拥有强大的多语言能力,支持 29 种以上语言。并且在专项模型方面,用于编程的 Qwen2.5-coder 和用于数学的 Qwen2.5-math 都比前代有了实质性进步。多模态模型方面,视觉语言模型 Qwen2-vl-72b 也正式开源,具有强大的视觉理解能力。
亚马逊推出Amelia,面向第三方卖家的人工智能助手
美东时间9月19日,亚马逊推出人工智能工具Amelia,旨在帮助第三方卖家快速解决账户问题并获取销售和库存数据。该产品目前正为部分美国卖家进行测试,今年晚些时候将更广泛推出。阿梅莉亚被描述为“一体化、基于生成式人工智能的销售专家”,通过卖家中心提供服务。它是亚马逊过去一年推向市场的最新生成式人工智能工具。亚马逊还推出过人工智能购物助手鲁弗斯、企业聊天机器人 Q 以及面向云客户的生成式人工智能服务 Bedrock,并计划用生成式人工智能功能升级 Alexa 语音助手。公司已向 OpenAI 竞争对手 Anthropic 投资数十亿美元,首席执行官安迪·贾西称“生成式人工智能机遇”前所未有的,增加资本支出有必要利用这一机遇。
字节跳动宣布豆包大模型将于 9 月 24 日发布视频生成模型
9 月 18 日消息,字节跳动宣布豆包大模型将于 9 月 24 日发布视频生成模型,并带来更多模型家族的能力升级。9 月 24 日 14:30,2024 火山引擎 AI 创新巡展・深圳站将在深圳举行,字节跳动会在大会上公布火山引擎整体介绍、豆包大模型进展、火山引擎 AI 产品最新进展以及多个行业企业 AI 落地实践分享。
谷歌推出 DataGemma 以解决语言模型“幻觉”问题
9 月 12 日消息,谷歌基于谷歌数据共享(DataCommons)中的真实世界统计数据,推出了开放权重 Gemma 模型的新版本 DataGemma。DataCommons 汇集了来自联合国、疾病控制与预防中心等可信组织的超过 2400 亿个数据点,确保 DataGemma 的输出基于真实可信信息,提升模型准确性。
DataGemma 采用检索交错生成(RIG)和检索增强生成(RAG)核心技术。RIG 主动查询可信来源后生成回答,如被问及特定问题会在回答中穿插实时统计数据。RAG 在生成回答前检索相关信息,借助长上下文窗口确保回答全面性,并引入表格和脚注提供更深层次上下文。
目前谷歌对 RIG 和 RAG 的研究处于初期阶段,但成果令人鼓舞。DataGemma 模型在处理数值事实和统计查询方面有显著提升。研究团队已发表论文详述方法,强调其对大型语言模型判断何时依赖外部数据与内部参数的帮助。
当前,DataGemma 仅供研究人员使用。谷歌希望公开发布 DataGemma 及其方法,推动进一步研究,为构建更强大、更有根据的模型开辟道路。
OpenAI放大招!发布最强水平大模型,相比 GPT-4o 有更大提升
9月13日凌晨,Open AI发布了其首款具有推理能力的模型,代号OpenAI o1。这是一款全新AI模型,能推理复杂的任务,解决比以前科学、编程、数学模型更难的问题。
OpenAI o1是全新系列AI模型的第一款。与以往模型不同的是,它拥有进化的推理能力,会在回答前进行缜密思考,生成一个长长的内部思维链。有了这个模型,OpenAI的工具能够解决多步骤问题,包括复杂的数学和编程问题。
OpenAI强调o1的这次发布为 “预览版”,还只是初始状态。与此同时发布的还有更小、更便宜的版本o1-mini 。对OpenAI来说,o1 代表着向其更广泛的类人人工智能目标迈出的一步。
OpenAI 的 o1 系列模型已向企业版和教育版用户开放访问权限
9 月 22 日消息称,OpenAI 在9月13日发布的 o1 系列模型(包括 o1-preview(下称 o1)和 o1-mini),现已向企业版(Enterprise)和教育版(Edu)用户开放访问权限。用户每周最多可输入的消息数量情况为:o1 模型每周最多可使用 50 次,而 o1-mini 模型每天最多可使用 50 次。
o1 系列模型具有更高的理解能力,在回答问题前会进行深度思考,生成内在的思维链后再给出答案,因此能够处理比之前模型更复杂的任务,特别擅长解决科学、编程和数学领域的难题。不过,o1 模型在广泛知识处理和实际应用等方面仍有局限。在价格方面,o1 的输入词元费用为每百万个成本 15 美元(约合人民币 107 元),输出词元费用为每百万个 60 美元(约合人民币 427 元)。
JetBrains 发布基于阿里云通义大模型的编程助手 JetBrains AI Assistant
9 月 19 日 - 21 日的云栖大会上,JetBrains 正式发布了基于阿里云通义大模型的 JetBrains AI Assistant。
JetBrains AI Assistant 与多款 JetBrains 产品深度集成,是专为中国开发者量身定制的 “提效神器”。它支持全链路优化开发,可在特定 IDE 工具窗口中作为内联操作使用,也可以通过内置聊天使用,不会中断开发工作流。此外,JetBrains 承诺所用模型绝不会在开发者的代码库上训练,确保专有代码保持机密和安全。
5. 优化代码:如重构、声明重命名建议。
百度联盟大会在深圳召开,发布首个智能体联盟解决方案
9 月 12 日,百度联盟大会于深圳举行。会上,百度向联盟伙伴全面展示智能体在开发平台、分发场域及变现解决方案等方面的全链路布局,同时发布首个智能体联盟变现解决方案以及“分发 + 变现”一体化解决方案,为联盟伙伴及智能体开发者带来新场景、新流量与新变现机会。
在开发方面,文心智能体平台将开发门槛降至最低,实现“一句话开发智能体”,目前已吸引 10 万家企业、60 万名开发者,覆盖上百个应用场景。
分发方面,百度形成以搜索为代表的智能体分发池。百度副总裁、百度搜索总经理赵世奇以“1+n”总结智能体在百度搜索的分发策略,8 月智能体在百度生态日均分发量突破千万。
变现方面,智能体变现解决方案针对有分发能力但变现难的合作伙伴,采用创新广告和服务直达变现模式;智能体分发 + 变现一体化解决方案适用于已开发智能体但缺少分发媒体场景与配套变现能力的合作伙伴。
寒武纪开源了PyTorch设备后端扩展插件Torch-MLU
9月12日消息,寒武纪开源了PyTorch设备后端扩展插件Torch-MLU,并实现了寒武纪硬件对于PyTorch的原生支持,充分提升了开发者的使用体验和集成效率。
点击“阅读原文”了解SaaS大会