金融时报:某为漏洞百出的软硬件有碍在 AI 领域取代英伟达的努力

文摘   2024-09-07 01:53   湖南  

内容提要:

某为的 Ascend 系列软硬件Bug多多,漏洞缠身。某为的解决之道:向客户派遣工程师服务团队现场解决问题。某为称其上半年的AI芯片收入增长了34%。国内AI公司寻找漏洞绕过美国限制,以获得英伟达更先进的产品或者算力服务,从侧面验证了某为AI产品与英伟达存在的显著差距。国内芯片自主开发自主制造的目标和决心非常宏大,竞争或许能够解决某为AI产品的Bug。

一、某为的 Ascend 系列软硬件Bug多多,漏洞缠身。

9月3日,金融时报在截图所显示的这篇文章中,披露某为在国内推广Ascend 人工智能芯片获得成功之后,因充满BUG的软件导致客户在使用过程中问题多多,导致国内AI企业在人工智能方面的计算能力与美国相媲美的努力,正受到漏洞缠身的软件的阻碍。

报道称,去年 10 月,华盛顿进一步收紧了对高性能芯片的出口管制,助推某为成为AI开发行业领导者英伟达 (Nvidia) 的国内替代品的领跑者。某为的 Ascend 系列因此成为国内 AI团队运行推理的为数不多的选择之一,而该过程是国内AI企业从OpenAI 的 ChatGPT 等应用程序使用该过程来生成对查询的响应的中间过程。

但包括合作伙伴公司的一些AI 工程师在内的多位业内人士表示,这些Ascend系列芯片在模型的初始训练方面仍远远落后于英伟达。他们归咎于稳定性问题、芯片间连接速度较慢以及某为开发的名为 Cann 的劣质软件,此外,难以从英伟达产品切换。

英伟达的软件平台 Cuda 被称为该公司的“秘密武器”,因为它易于开发人员使用并能够大大加快数据处理速度。某为是众多试图通过创建替代软件来打破英伟达对 AI 芯片的束缚的公司之一。

某为开发的替代Cuda的软件是Cann。金融时报在文中称,某为自己的员工也在抱怨 Cann 不成熟。一位不愿透露姓名的研究人员表示,这使得 Ascend 产品“难以使用且不稳定”,并且测试工作受到阻碍。

他们说,Cann存在的主要问题是:“当随机错误发生时,由于文档记录不佳,很难找出它的来源。您需要有才华的开发人员阅读源代码以查看问题所在,这会减慢一切速度。这说明Cann的代码不完美,Bug较多“。

另一位了解某度使用某为Ascend处理器的工程师表示,这些芯片经常崩溃,使人工智能开发工作复杂化。

这位某为研究人员表示,发生崩溃是因为硬件难以使用。他们说:“很容易得到糟糕的结果,因为人们对硬件本身了解不多”。

二、某为的解决之道:向客户派遣工程师服务团队现场解决问题。

多位知情人士表示,为了解决这个问题,某为一直在派遣工程师在现场帮助客户将之前在 Cuda 上编写的训练代码转移到 Cann 中。这些人士表示,某度、科大某飞和腾某等科技公司都接收了某为的工程师团队。

科大某飞表示,在某为去年派遣了一组工程师到其位于国内东部合肥的总部集成该技术后,其大型语言模型完全在某为芯片上进行了训练。

某为拒绝置评。某度、科大某飞和腾某没有回应置评请求。

一位前某度员工说:“某为擅长使用客户服务来弥补他们唱片性能的不足,所以他们当然会在大客户现场派工程师,帮助他们使用芯片”。

某为可以利用庞大的员工队伍来加速这一转变。据该公司称,其 20.7万名员工中有 50% 以上从事研发工作,包括被派遣为客户安装技术的工程师。

咨询公司 Gavekal 的技术分析师 Tilly Zhang 说:“与英伟达相比,某为的优势在于它可以与客户密切合作,与英伟达不同,它拥有一支庞大的工程师团队来帮助解决客户的问题并让他们过渡到某为的硬件” 。

某为还建立了一个在线门户,供开发人员就如何改进其软件提供反馈。

三、某为称其上半年的AI芯片收入增长了34%。

知情人士称,在美国10月收紧出口管制后,某为将用于训练的芯片Ascend 910B的价格提高了20%至30%。

某为的客户还对 Ascend 芯片的供应限制表示担忧,这可能是因为制造困难,国内公司无法从荷兰公司 ASML 购买最先进的芯片制造机械。

某为周四报告称,国内对其 AI 芯片的需求强劲,上半年收入增长了 34%,但没有提供其不同业务的销售额明细。

某为执行董事张总在 7 月于上海举行的世界人工智能大会上表示,已经在 Ascend 芯片上“训练和迭代”了 50 多个基础模型。

四、国内AI公司寻找漏洞绕过美国限制,以获得英伟达更先进的产品或者算力服务,从侧面验证了某为AI产品与英伟达存在的显著差距。

事实上,或许是某为Ascend 芯片产能跟不上需求,或许是一些客户拒绝使用Bug较多的某为AI产品,自从华盛顿开始限制国内获得尖端芯片以来,国内AI公司一直在寻找漏洞来绕过这些限制,以获得英伟达更先进的产品或者算力服务,这已经不是什么秘密了。

寻找漏洞来绕过这些限制的通常办法包括:通过小型分销商采购,在海外数据中心从谷歌和Microsoft等云提供商那里租用英伟达支持的服务器。

加密平台也加入了这一游戏。本周早些时候,在香港一家虚拟资产交易所举办的研讨会上,该交易所正在全球范围内收集和“代币化”闲置的计算能力,以便将其出售给中小型公司,包括来自内地的客户,同时掩盖他们的身份。

这种做法并非该交易所独有,但在加密货币行业广为人知。近几个月来,其他去中心化 GPU 公司公开推广服务,以经济高效的价格提供英伟达支持的计算能力。

五、国内芯片自主开发自主制造的目标和决心非常宏大,竞争或许能够解决某为AI产品的Bug。

虽然某为的AI产品追上英伟达,还有很长的路要走。但国内芯片自力更生运动的时钟正在滴答作响。根据全球芯片行业协会 SEMI 的数据,今年上半年,由于担心西方进一步限制出口,国内在芯片制造设备上花费了创纪录的 250 亿美元,超过了韩国、宝岛和美国的总和。

日经亚洲报道称,对半导体设备的投资是未来市场需求的重要指标和行业前景的晴雨表。

预计国内也将成为建设新芯片工厂的最大投资者,其中包括购买设备,预计全年总支出将达到 500 亿美元。

国内对芯片生产设备的创纪录投资不仅得益于中芯国际等顶级芯片制造商的推动,还得益于中小型芯片制造商的增长势头。预计明年支出将再增长 20%,最近的拆解显示,国内的芯片制造能力仅落后台积电3-5年。

或许国内有第二家、或者第三家科技公司切入人工智能芯片行业,与某为的AI芯片形成竞争。因为只有竞争,才能推动发展。也只有竞争,才有可能解决Ascend 硬件与软件上存在的许多Bug。

推荐阅读已发历史文章:
制裁毁了俄罗斯航空业,支线客机生产一再延迟,普京龙颜大怒!
墨西哥对华商,从最初的双臂欢迎到现在变得不满,发生了什么?
从苹果在印度生产新一代iPhone高端机型,想到我们的营商环境
推荐观看火星数据研究所视频:

【作者:徐三郎】


三郎宏观
解读宏观经济现象,普及战争经济学
 最新文章