虽然已经两年多过去了,但我仍然清楚地记得2022年11月30日ChatGPT发布的时候,它带给国内的巨大震撼。那两天,它可以说是中国最热门的新闻了。
所有人都惊讶地第一次发现,一个软件竟然能够像人类一样和我们用自然语言流畅地进行对话。当时让人感觉美国又率先在人工智能方面领先了中国一大步。
而且这让人产生了落后的担忧和焦虑,毕竟人和机器交互方式的每一次进步,都会带来巨大的革命性改变,比如当年的计算机最开始是各种命令行界面,后来出现了不需要输入命令的图形界面,微软在1985年11月发布的Windows 1.0就长这样(图形界面),直接点击图形化的按钮就好了。
再后来微软在1995年8月发布了Windows 95,有了开始菜单、任务栏和桌面图标,变成了现在的经典桌面,获得了巨大的成功。
同样地,苹果手机在2007年1月发布了iPhone,把键盘变成了触摸屏输入,大大提高了手机的屏幕占比,从而开启了智能手机时代,并且颠覆了之前的大部分手机巨头。因此ChatGPT这种全新交互方式的出现,也很容易让人想起历史上这类故事,让人觉得会不会又一个属于美国的Windows,iPhone时刻要来了。
不仅如此,在ChatGPT出现之前的三个月,美国政府已经在当地时间8月26日通知英伟达对中国禁售A100和H100高端AI GPU,这意味着硬件性能方面中国已经受到了限制,中国公司已经没有办法购买高性能的英伟达硬件来训练大模型了。所以当时这种“中国在AI大模型落后,再加上硬件又被美国制裁”的局面,一度让人对中国人工智能的前景感到担忧。
但2025年的今天,我们显然已经可以暂时松口气,我说的倒不是中国的人工智能已经像六代机一样领先美国了,而是说中国追赶的速度还是令人满意的,为什么呢?我就说四点:
第二点是大模型技术中国在逐渐赶上来了,而且已经丰富多彩了。
根据不同的特色,现在我可以简单地把国产大模型分为几类:
1、有拼多多类型的,例如最近这段时间火爆的是12月26日发布的DeepSeek V3开源语言大模型,它火爆倒不是因为性能大大超过了国外同行,而是同样性能下对算力的节省表现的不错;
2、还有经常出现在各种全球大模型排行榜的,比如通义千问、智谱清言等;
3、还有日常普通人用的最多的,比如字节的豆包、月之暗面的kimi、百度的文心一言之类。现在在百度搜索栏操作,就调用了文心一言大模型的AI搜索能力。2024年11月的日活使用量,豆包已经逼近900万,而在2024年大火的kimi日活也有300万了,注意这是日活,已经是很高的使用量了,而且还在迅速增长。尤其是这个豆包,aicpb网站的排名说2024年11月的MAU(月活用户)人数已经5998万了,全球仅次于ChatGPT的2.8725亿排名第二。
4、基于行业场景,作用于改变业务流,提升生产力效率的行业大模型。典型的如华为云的盘古大模型,科大讯飞的星火大模型等等,都在行业已经有不少应用。这部分虽不为大众所熟知,却是扎扎实实带来行业变革,促进经济增长的“数智引擎”。
2024年11月18日,分析机构沙利文(Frost& Sulivan)发布了《中国行业大模型市场报告,2024》,其中提到华为云的盘古大模型,在行业大模型领域取得政务、工业、金融3个市场份额第一,其中政务大模型领域盘古大模型份额占50%,工业大模型领域盘古大模型占38%,金融大模型领域盘古大模型份额为33%。
这三个行业,政务和金融都关系到国家安全和稳定,工业则是中国的根基,他们都是选择华为云盘古大模型的最多。普通消费者听说过华为云盘古大模型的人并不太多,是因为华为云对盘古大模型的定位是更多地专注于to B的产业应用领域。到2024年5月,华为云盘古大模型都已经迭代到5.0版本了。展现了让我觉得非常强大的功能,比如建筑设计师画个草图,盘古大模型就能给建筑上色,并生成360度的建筑视频,对于设计师来说节省了大量的精力和成本。
再比如这个功能也实在惊艳,你拍一个视频,盘古大模型就能够自动变成动漫,而且表情和长相都还是一样,这对影视制作来说能大大提高效率。
另外值得一提的是,科大讯飞的星火大模型也是基于昇腾云算力在运行。
所以你看,从2022年11月30日到今天也才两年多的时间,中国的人工智能大模型就迅速涌现,并经历了从“百模大战”到已经有头部的大模型开始脱颖而出的态势,并且他们还各有特色。虽然说这两年都在反内卷,但另一方面,进步也确实快。
第三点是中国的AI在各行各业的应用的广度和深度已经非同一般,这方面我认为已经超越美国。
当地时间12月20日,美国《华盛顿邮报》发表了对前谷歌CEO埃里克·施密特(Eric Schmidt)的专访视频。他说中美两国在人工智能领域在进行史诗般的斗争,印象最深的还是他说了以下两句话:
“中国能够把人工智能技术应用到现实世界中,这是我们只能梦想的事情。”
“我认为有充分的理由相信,即使我们赢得了比赛的第一部分,中国最终也会赢得比赛,因为他们能够在批量生产中更快地应用这种技术。”
施密特在中国其实算比较有名了,就在一年多以前的2023年10月,他还很自信地说中国的人工智能落后美国,但一年多后已经开始担忧中国会最终赢得比赛了,理由是中国能把AI用起来。
人工智能在中国最让我们熟知的应用就是智能手机以及自动驾驶,现在没有自动驾驶和智能座舱功能的汽车,在中国市场已经卖不出去了,而智能化程度高,自动驾驶功能强大的汽车,比如问界M9则在2024年大定20万辆,占了中国市场售价50万人民币以上汽车销量的一半,历史上第一次在该领域超过了国外品牌。
1月8日,中国科协、清华大学和环球时报社联合发布了2024年“新质生产力产业实践示范案例”50强榜单。
我看了下这些案例,发现AI在国内各行各业的应用已经非常普遍,几乎各行业的头部企业都已经进行了实质性的AI应用,我这里从这些案例里面举几个例子:
1)物流行业
顺丰的丰语大模型,这是专为物流行业设计的AI语言模型,摘要准确率超95%,已在20多个业务场景中应用。快递小哥要是有专业问题可以用手机问丰语,比如某个物品能不能寄某个国家,答案就会立刻出现,这显著提升物流服务效率和质量,而且能让新员工的工作效率接近老员工,减少出错概率,更快学习成长。再比如自动填单功能,用户在输入的时候,丰语大模型会自动猜测想填的内容,直接点一下就自动填好了,无需各种文字输入。
2)互联网行业
腾讯音乐打造MuseLight大模型推理加速引擎,能为用户个性化推荐音乐,根据歌曲的内容自动生成合适的歌单封面,还能为创作者作曲提供各种推荐和灵感,并快速地创建乐谱,大大提升创作效率;另外还可以进行音乐版权检查,版权纠纷显著下降。
3)制造行业
安徽海螺水泥集团也将大模型应用到了生产流程。水泥熟料是一种半成品,主要用于制造水泥。它是由石灰石、粘土和铁质原料按适当比例混合后,经过高温煅烧部分熔融并快速冷却而得到的产物。国家规定要求水泥熟料3天和28天后的强度要达标,才能用于生产水泥,很显然如果放置这么多天后才发现强度有问题,那就影响了生产。而通过大模型则可以进行3天和28天强度的预测,可以在早期就发现问题。值得一提的是,海螺的大模型开发依托的就是华为云盘古大模型。
中国应用了AI的行业远不只是以上。上海宝武钢铁热轧生产线每次调整生产钢板的种类和尺寸,都需要工程师重新调整7道精轧机组的300多个参数,需要耗费约5天的时间。他们使用了华为云盘古大模型后,能够对最优参数进行预测,显著降低热轧生产线调优时间,并提高预测精度和钢板成材率。盘古大模型在宝钢1880热轧生产线上线后,预测精度提高5%以上,钢板成材率提升0.5%,预计每年可以多产钢板2万余吨,年收益达9000余万元。
中国的动车也大量使用了AI技术。全国每天需要检测的动车大概有3.2万节车厢,过去需要大量的巡检工人在凌晨时段去完成,耗时耗力。如今结合盘古大模型和巡检机器人,可精准识别一列动车的3.2万个项点(检查点),覆盖8大类、350多种复杂故障,极大提高了高铁运营效率,降低了成本,也减少人工在凌晨时段去巡检的艰辛作业。
能源行业的山东能源,电力行业的南方电网、国家电网等等,都已经在应用AI,像国家电网的输电线路竟然长达两百多万公里,他们已经购买了至少几万架无人机做巡检,它们通过AI视觉就可直接判断有无问题。