最近一家叫商汤的科技公司,股价上市从10元一直跌到0.58元,然后3天时间又直接翻1倍到1.2元。商汤的“暴利式上涨”直接让投资者大开了眼界,不知道的还以为商汤发布了“中国版GPT-5”!
股价异动一天之后,商汤集团终于发布公告。公告对推出日日新5.0业务做了一番简短介绍,对于股价的不寻常波动,公告中称,“董事会并不知悉有关价格和交易量变动的任何原因,或须予以公布以避免本公司证券出现虚假市场的任何资料,或根据香港法例第571章证券及期货条例需进行披露的任何内幕消息。”
从目前来看并没有什么交易异常,市场的焦点基本还在商汤发布的大模型上。那么国内大模型月月都有上新,商汤大模型特殊在什么地方呢?
4月23日,商汤科技举行新品发布会,亮出了大模型最新成果——“日日新5.0”。据介绍,该模型采用了时下流行的MOE(Mixtureof Experts)混合专家架构,拥有高达200K的推理上下文窗口,旨在全面对标GPT-4Turbo——OpenAI迄今为止最强大的大型语言模型。
日前,中文大模型测评基准SuperCLUE发布最新榜单,对商汤科技全新升级「日日新SenseNova 5.0」大模型进行了全方位综合性测评,结果显示在SuperCLUE综合基准上,日日新 5.0表现不俗,以总分80.03分的优异成绩刷新国内最好成绩,并在中文综合成绩上超过GPT-4-Turbo-0125。
商汤发布截至2023年年度业绩公告,公司实现营收34亿元,同比下滑10.6%;年度亏损64.95亿元,较2022年同期的60.93亿元增加6.6%。整体上看依然难言摆脱亏损上岸,但来自生成式AI业务的收入为12亿元,同比增长200%。
商汤为此将原本的 4 个主营业务——智慧城市、智慧商业、智慧生活和智能汽车,重新划分为 3 大板块——“传统 AI” 业务(智慧商业、智慧生活、智慧城市构成)、“智能汽车业务” 和 “生成式 AI 业务” 。商汤对这些业务态度分明:收缩传统 AI 业务,集中资源投入生成式 AI 业务。
这是商汤成立以来的最大一次转型,它已部分反映在业绩上:据今年 3 月底发布的 2023 年年报,商汤生成式 AI 业务去年的总收入达 12 亿元人民币,营收占比为 35%,而过去曾占商汤收入大头的智慧城市业务占比已降至 10% 以内。一位商汤管理层人士预测:今年或明年,商汤生成式 AI 的营收占比例将超 50%。
国内这一两年来但凡跟AI沾点边的上市公司,都在努力全面拥抱AI尽全力把自己包装成为AI大模型公司,在各种榜单上各种限定词下超越GPT-4。投资人朱啸虎曾言,“大家都说自己很快能超越GPT-4,但好像没有一家能做得出来。” 李开复也十分直接地抨击了“作秀式的评测方式”,他指出“相反,那些选择作秀式的评测方式,忽视真实应用效果的厂商,模型能力与市场需求之间的鸿沟会越发明显,最终将难以在激烈的市场竞争中立足。”
那么商汤凭什么脱颖而出呢?OpenAI首席科学家Ilya Sutskever的老师神经网络之父Geoffrey Hinton指出,大模型竞争最终要靠大量数据和高计算规模(硬件能力)。商汤在视觉识别领域的积累在国内绝对是第一梯队的,这在多模态大模型研发中多少会有点优势。其次,据了解,2023 年初时,商汤大装置就已有 2.7 万张 GPU,目前则上升至 4.5 万张GPU,算力较去年翻倍。是不是最强的不好说,但至少对小米、工商银行、本田、广汽有一定吸引力。
大模型已能解决越来越多问题,但是随着技术发展,商汤认为模型并非越大越好。为了更好适应端侧场景,商汤还训练了一系列不同规格的小模型,它们能在汽车、笔记本电脑和手机等移动设备上运行。商汤已与早期客户小米、荣耀等手机品牌达成了共同探索更多端侧应用的合作。汽车客户则有本田和广汽埃安等,其模型已运营在上百万辆汽车上。
在《LLMs正达到收益递减的证据——及其可能意味着什么》一文中,作者提到“大模型在性能提升方面可能已达到收益递减的临界点。”作者以OpenAI为例,认为:“从GPT-2到GPT-3的巨大飞跃。从GPT-3到GPT-4的巨大飞跃......GPT-4到GPT-4 Turbo就没有那么多了。”
简单来说按照目前的性能指标各家大模型表现并没有指数级差距,也就是目前无论国内还是国外非常容易陷入同质化竞争。所以OpenAI还是微软谷歌都在强调需要“降本增效”,技术投入和商业化都需要重视。微软总裁纳德拉指出过去一年 GPT-4 性能提升了 6 倍,但成本降低到了之前的 1/12,对应性能/成本提升了 70 倍。
对于存在“先天不足”的国内大模型来说,现阶段必须“尸山血海”的卷出来,不然很难活到AI下一个爆发阶段。
5月13日,OpenAI推出了新一代的大模型GPT-4o,除了性能上的大幅提升之外,更重磅的是该新模型将全部功能有限度的免费使用。不难看出OpenAI对目前的商业化进度并不满意,免费开放或许才能创造更大的市场更多的营收。
带头大哥都如此,那国内大模型没有理由不跟进。5月6日,国内创业公司幻方旗下的大模型公司「深度求索」开源了第二代 MoE 模型:DeepSeek-V2,主打参数更多、能力更强、还把推理成本降到了 1 块钱/百万 token,也就是说,成本是 Llama3 70B 的七分之一,GPT-4 Turbo 的七十分之一。
智谱AI在5月11日宣布大幅降价,新注册用户获得的额度从500万tokens提升至2500万tokens,GLM-3 Turbo模型中,用户1元可以买100万tokens。
字节跳动在15号发布会上,宣布降价,相当于1元可以买125万的豆包pro32k模型tokens。
5月21日,阿里也降低了大模型价格,通义千问GPT-4级主力模型Qwen-Long,API输入价1元可以买200万tokens。
百度智能云官宣文心大模型主力模型ERNIE Speed(上下文长度 8K、128K)、ERNIE Lite(上下文长度 8K、128K)免费。腾讯混元大模型也宣布全面降价,混元-standard API输入价格从0.01元/千tokens降至0.0045元/千tokens,下降55%,API输出价格从0.01元/千tokens降至0.005元/千tokens,下降50%,lite版免费。
大有不赚钱也要卷死对手的架势,但是目前的免费主要针对的是C端B端市场还做不到免费。B端商业市场免费并不重要,重要的是能否落地产生利润,如果费效比高那么贵一点也不是不能接受。
有业内人士指出衡量大模型成功与否的标准,并不只是有多少参数,而是它究竟能解决什么样的场景难题,而且这个场景问题,用AI解决成本更低、安全性更高。
正如百度总裁李彦宏所说生成式对话价值不大,但结合具体业务的AI应用价值巨大。
例如去年底发布以来,阿里巴巴近1.7万中小外贸商家订购了AI生意助手,发布了上百万商品,搜索量提升近四成。字节跳动将豆包大模型接入了抖音、飞书等业务,日均处理1200亿token文本。腾讯已经把混元大模型用在了会议、读书与游戏客服上;这家社交巨头最大的资产是用户时间,AI支持的广告服务的点击率与交易量实现了两位数的上升。
商汤一开始的重点就不在C端的通用大模型,而是尝试在做好端侧大模型,满足客户出于轻量敏捷、安全稳定和成本等方面的考虑,在设备本地运算端侧大模型。商汤新推出的1.8B(18亿)参数规模的SenseChat-Lite版本端侧⼤模型,在基准测试中,全面超越了MiniCPM-2B、Phi-2等所有开源的同量级的大模型,甚至越级比肩一些7B、13B的大模型,性能、指标非常硬核。
商汤首席科学家王晓刚曾与媒体交流,“每年有30亿部手机,PC出货量一年有2-3亿台规模,AI PC可以成为我们每个人的助手,汽车智能化也处在重要的发展机遇期。”与商汤在端侧大模型展开合作的,已经覆盖了国内绝大部分的手机厂商和知名车企。
不过端侧大模型也存在不同类型终端系统繁多、算力水平差异大且适配困难,通信情况复杂且不稳定等问题。如果没有明显优于GPT系列的能力,那么长期来看会出现留存率低用户付费意愿低的情况。
有市场人士认为国内AI公司存在以下上市套路:第一步大额融资,第二步不顾亏损和质量做大收入,第三步冲击IPO,第四步收入下滑,毛利率上升,应收账款大额坏账,第五步市值持续暴跌。普遍存在单个行业还没有深耕好,就开始摊大饼式的发展,追求收入和合同规模的增长,低价竞争和垫资,而忽视了经营的可持续性和竞争力。
过去的商汤赶上了互联网加的风口,追求算法能力的泛化尽可能做大的确存在以上嫌疑,但如今的商汤更加专注于结合具体场景的解决方案,为客户带来成本优化和收入成本。商汤未必能走到最后,但至少目前还在正确的道路上。
但在大模型卷上天的大背景下,不能只是说我有客户我能落地,现在的投资人不仅要看研发投入、营收规模及增速,也更看重主业净利率水平。
去年大模型爆发的一年,商汤反而研发投入只有34.66亿元,同比下降近14%,这跟国内外大厂不断加码AI的态势形成了鲜明对比,让投资人不得不担忧商汤后面是否能够跟上。
国金证券分析师近日发布研报,预计商汤2024至2026年归母净利润分别为-47.8/-33.8/-20.1亿元,亏损同比缩窄25.8%/29.3%/40.5%。
根据券商预计,商汤未来还将继续亏损,预计2024至2026年合计亏损100亿元,当然实际情况如何,有待时间验证。AI的成长空间依然很大远没有到尽头,但是还能带飞商汤多远并不是明确的事。某种程度上来说AI既是蓝海也是红海,综合素质更强的大模型才能笑到最后。
不管媒体们如何渲染AI强大颠覆世界,都不要忘了,AI至今仍然是一个长周期,高成本投入回报慢的行业。
5 月 23 日,美国众议院外交事务委员会以压倒性多数投票提交了一项法案,该法案将使美国政府更容易限制 AI 系统的出口。其意在限制中国使用美国开源大模型,可能会对一些依赖美国大模型微调的企业形成一定冲击。虽然这次只是外事委员会的初步投票,但目前紧张的地缘环境后续加码限制AI将会是大概率事件。
对于中国AI企业来说,开源虽然更容易上手见效快,但被封禁惨遭清零的风险显然越来越来。不管是商汤这类传统AI小巨人也好,还是大模型五虎,该交的学费不可避免,自研弄潮者或许才能走得更远。
如果你是AI从业者或者对其相当感兴趣,
请加作者微信,拉你进AI高质量交流群
参考资料:
商汤“一日惊魂” 来源:凤凰财经
中国大模型价格战背后的真相 来源:极客公园
大模型价格战开打 来源:新硅NewGeeK
商汤科技如何“封神”?来源:Z Potentials
商汤科技欲借大模型翻身 来源:产业资本
商汤转型生成式AI这一年 来源:LatePost
端侧大模型将商汤推向了关键时刻 来源:新眸