本期话题:
00:30 另辟蹊径!给芯片圈一点小小的震撼
06:13 中国芯应该走“C”路线?RISC-V架构是最优解
14:47 大模型VS推理模型,中国更适合哪个?
点击下方小程序收听现场音频
另辟蹊径!给芯片圈一点小小的震撼
幻实(主播):
欢迎大家关注芯片揭秘,我是幻实,今天我们要聊的是一家和算力打交道的公司,这也是最近非常火爆的一条赛道,坐在我身边的这位就是来自广州希姆半导体科技有限公司的CEO梅迪梅总,希姆计算这家公司有着大名鼎鼎的股东,以及行业内非常头部的客户,目前他们也取得了非常不错的进展,所以我非常期待和梅总一起聊聊您创业背后的故事。
梅迪(嘉宾):
好的,我们可以开放地聊一聊,包括为什么您看到我们比如说投资人、客户,以及一些重大策略和战略都不太一样,坦白地说,我们创业大约在2018、2019年,那个时候正好也是国产大芯片或者说半导体创业的最活跃的一个时期,但那个时候,国内大芯片的基础比较薄弱,这里我指的是设计基础。而从投资人角度来看,可能大部分投资人的观点和视角还是在于国产替代,所以我们会看到很多公司,比如做GPU或是做一些CPU的团队都是从NVIDIA、AMD等地方出来,然后做国产替代这件事情。
芯片揭秘 主播幻实(右) 对话
广州希姆半导体科技有限公司 CEO梅迪(左)
幻实(主播):
对,现有的产品可以直接pin to pin地解决它。
Pin to Pin:两个集成电路(IC)的引脚功能完全一致,包括它们的封装也完全一致。这种情况下,如果某个集成电路不再生产或者需要替换,可以使用另一个Pin to Pin的集成电路来替代,而无需改变印刷电路板(PCB)的设计。这意味着,Pin to Pin替换是一种方便且成本效益高的解决方案,允许设计师在不需要重新设计电路板的情况下,轻松替换损坏或不再可用的组件。
梅迪(嘉宾):
以前这个团队可能参与过类似的产品制造,出来以后再把这个产品重新在国内做一遍。
幻实(主播):
那时候的主流思路就是这样。
梅迪(嘉宾):
因为很多投资人可能都不太能判断怎样的技术路线更好,我们那时候其实也是遇上了一个比较好的契机,我们的天使投资人是国内最大的一家互联网公司——字节跳动,其技术实力毋庸置疑是顶尖的,而我们应该是字节跳动在相当长的一段时间内唯一投的项目。
比较幸运的是,在那个时间节点上,无论是我们客户本身对AI的理解,包括他们的需求,还是国际上AI计算芯片的发展成熟度,包括RISC-V开源的技术的成熟程度都刚刚好能够让我们从另外一个视角去思考这个问题。而从商业化角度来讲,最后真正能给客户带来更好价值的可能就是技术线路,当然,也包括能力和最后能实现目标路径的难易程度等各种因素。
STCP920人工智能计算卡(图源:希姆计算官网)
幻实(主播):
所以当时你们走了一条差异化的路线来定义未来计算方向的产品。
梅迪(嘉宾):
没错,而且应该用怎样的路线去解决问题,我们也很清楚。但退回到那个时候,其实基本上没有人会选择我们,而且当我们和很多人讲到RISC-V的时候,大家不一定能理解这个概念。所以我们股东结构比较好的原因其实是因为很多人都相信字节跳动的技术线路的选择能力,可以说我们从一开始就走了一条和别人不太一样的道路。
但如果到今天再回过头看,基本上我们看到的美国互联网的巨头或大客户,他们如果要设计AI芯片,几乎无一例外,用的都是RISC-V,没有人在NVIDIA或AMD后面再重复走GPU的道路,因为想要在这条道路上形成对一些头部企业的挑战其实难度非常大。
GPU:全称为图形处理器(Graphic Processing Unit),是一种专门设计用于处理计算机图形和图像的处理器,可以加速计算机图形渲染和处理操作,提高计算机图形和图像的性能和质量。相对于CPU而言,GPU具有更多的处理单元和更高的并行处理能力,因此可以更快地处理大量的图形和图像数据。
幻实(主播):
所以只能换一条路走,如果用他们擅长的传统方式来解决存在的壁垒,那成功的概率微乎其微。
梅迪(嘉宾):
用一个简单的类比来讲,就像国产车,如果我们还在走油车的道路,恐怕很难超越欧美的一些行业巨头,因为他们在油车技术上积累了很多年,并且能力越来越强,特斯拉为什么能引领电车迅速发展?就是因为特斯拉的开源其实相对于我们硬件的芯片来讲,它们的本质是异曲同工的。
幻实(主播):
是的,选择算法的时候,如果是开源算法,就会存在非常大的竞争优势,至少没有了壁垒。
梅迪(嘉宾):
没错,还是拿车做类比,油车的发动机也好,变速箱也好,其核心专利、核心技术都掌握在几家头部大厂手中,而且他们会通过一些汽车认证,从而把门槛壁垒拉得更高。我们做新能源车的时候,你看特斯拉开源了,其实有很多公司把生产成本降下去,把充电的基础设施建起来,包括理想、蔚来都投入很多成本,甚至是传统的一些车企做新能源时同样投入了很多成本。把充电桩普及之后,反而是特斯拉或者是其他车企受益非常大,所以这相当于是大家用一个完整的生态、用很多企业来打破一两家企业造成的垄断局面,这实际上和做芯片有非常大的相似性。
2019-2025 RISC-V架构芯片数量(单位:亿颗)
(资料来源:半导体产业研究)
幻实(主播):
所以RISC-V出现的时候,我觉得所有芯片都可以用它再做一遍。那你们是在什么阶段发现了这个指令集,并且对它非常有信心?大家达成共识花了多长时间?
梅迪(嘉宾):
应该这样说,我们是先理解了客户的需求,字节跳动和我们做过多次交流,因此,我们很难单一地面对一个算法或一种算法做一个非常固化的硬件来支持它,因为算法的变化速度非常快,我们要从更高的维度来理解。如果让我们来理解AI芯片核心解决的是什么问题,其实非常简单,就是两个问题,一个是能不能做到在一样的支撑条件下,比英伟达 CPU的效能不低甚至更高;另一个就是它能不能有更好的可编程性和通用性,从而在算法迭代或变化的过程中,让工程师们更容易去编程。我们就以此为核心去寻找相应的技术线路去解决这些问题。
RISC-V:RISC-V是一种开源的指令集架构,它定义了一组基本的操作码和寄存器,以及一些可选的扩展指令。RISC-V的设计目标是提供一种完全开放的、真实的、简洁、灵活、高效、可扩展的指令集架构,适用于各种不同的应用场景和处理器实现。
RISC-V它是开源的,它可以扩展模块化,所以我们可以对AI的需求来定制指令,实现加速的效果。另外,RISC-V本身的模块化的指令,又是图灵完备,非常完整,可以做CPU,也因此,能提供给客户非常好的可辨认性和通用性,所以我们看过之后,几乎没有发现过更好的技术线路。它完全从定义问题、寻找解决问题的技术线路出发,可以说这就是最好的一条技术线路。
广州希姆半导体科技有限公司 CEO梅迪 做客芯片揭秘
中国芯应该走“C”路线?
RISC-V架构是最优解
幻实(主播):
用RISC-V来做计算芯片的这条技术路线,国内现在除了你们,跟上来的人多吗?选择这条路会不会很孤独?
梅迪(嘉宾):
过去其实还是比较孤独的,因为大家对此都心存怀疑,大多还是从国产替代角度来考虑问题,而非从国产创造角度。但随着美国的Meta、Google包括open AI自己投的公司,特斯拉的Dojo等全部是用RISC-V来完成的,再加上中美之间的一些地缘政治的影响,就在今年的4月26日,我国孙凝晖院士在十四届全国人大常委会举行第十讲专题讲座上作了题为《人工智能与智能计算的发展》的讲话,其中专门提到了我们要用什么样的技术线路来做人工智能的算力,他提到了“A”、“B”、“C”三条线路。
“A”就是跟着美国走扩大兼容之路,看起来越来越难;“B”是我们自己做一套B元的生态,类似于华为这种巨头,但他认为产业的凝聚,包括中西方之间的同步和共享都比较难实现;随后他专门提到“C”道路,他认为该条路就是RISC-V,然后走国际合作的方式。我们可以看到在今年,它其实已经变成了一个国家的大战略,变化非常大,后面,我们陆续会在北京、上海包括大湾区都看到国家做的很多举措,并且在未来的1~2个月里,无论是我们还是各个政府,可能在对RISC-V的扶持和推动上面都会有很大的动作。
幻实(主播):
这是一个路线的选择。
梅迪(嘉宾):
对,同样也是国家战略的选择。
幻实(主播):
这是一件很好的事,也证明你们当时押对了。
梅迪(嘉宾):
对于我们而言确实如此,其实有的时候就是这样,不管如何,到最后还是要回归到事情的本质,而且RISC-V确实有它独特的或者说不可替代的优势。
幻实(主播):
任何选择都有风险,但是选对了其实就会带来巨大的竞争优势,那您公司选择至今取得了哪些阶段性的成果,能和我们分享一下吗?
梅迪(嘉宾):
我们第一代12纳米芯片已经在2022年实现量产出货,无论是在互联网客户那边的落地,还是在很多算力中心的落地,我们都已经完成,包括现在第二代芯片其实也在紧锣密鼓地做一些调整,之所以说调整,是因为第二代芯片其实都已经制造完成,但它是5纳米的工艺,所以有些地方我们想再做一些挑战。
预计2030年全球RISC-V 端侧算力市场规模达到270亿元
复合增速35%(图源:网络)
从芯片角度而言,我们的产业化一直在稳步地往前推进。回到刚才举的车的例子,还有一点我想和大家分享一下,就是做大芯片,尤其是这种计算芯片,还是需要比较长的迭代周期,它不太可能只用一代或者两三年就解决一些关键性的问题,而且我们都知道前几天NVIDIA市值突破3万亿美元,已经超越苹果和英特尔,仅次于微软,位居世界第二。
幻实(主播):
是的,非常“逆天”,我们都在见证时代了。
梅迪(嘉宾):
没错,它的迭代速度其实非常快,想赶上是一件很困难的事情。所以还是要回到那个问题上,就是我们怎样才能有耐心和信心去做事情,还是拿车来做类比,我们的国产算力芯片和十几年前的国产车,其实在某种层面上意义很像,如果拿那个时候的吉利、北汽和凯美瑞、奔驰、宝马去PK的话,其实很难形成真正的竞争。但有一点是可以肯定的,就是路可以走,但我们不要再做车的生意了,我们要做出租公司的生意,把服务包进来。您刚才问到了阶段性的进展,其实我们投了很多资源,基于大模型做了一些行业应用的开发,把软件和硬件结合在一起,为客户提供完整的服务。
幻实(主播):
其实就是在建立生态。
梅迪(嘉宾):
是的,因为如果客户单纯地从软件角度来选择国产还是进口硬件的时候,选择非常困难,所以我们就想给客户一个交钥匙的方案,整个应用全部都给你做,这可能会带动我们的硬件往前升级,并且给我们带来迭代的空间和时间。就好像在过去,可能国产车只能用在出租公司,或者是一些比较边缘的场景,但到了今天,我们可以看到其应用非常繁荣,甚至已经大量替代了欧美进口车。现在很多高端的车也面世了,但这些其实都需要周期,归根结底,还是服务带动最后的硬件迭代。
2022-2030基于RISC-V的SoC芯片和CPU IP市场趋势及预测
(资料来源:半导体产业研究)
幻实(主播):
现在其实我们能看到全中国有很多地方政府都在国家的引导下建立了数据库、大数据局,顺应地就是建立超算中心。其实我能明确地感受到现在这些超算中心走的还是英伟达芯片的技术路线。最近我们也看到英伟达发布了它今年的最新产品,随之又引爆了话题,折射出的很重要的一点就是中国什么时候能追上,那基于您对RICS-V指令集带来的计算矩阵的理解,您觉得用你们的技术路线是否有可能追得上?在怎样的条件支撑下,可能会实现更快的追赶呢?
梅迪(嘉宾):
其实RICS-V的好处一方面是开源模块化,因为它可扩展,更容易让大家做对该场景友好的或者偏向该场景的一个专用性。英伟达创始人黄仁勋先生在今年年初美国的会上也说过,通用计算时代结束了,加速计算时代来临了,RICS-V的好处其实是可以把颗粒度做得更细一点,这就对应了我对什么场景做加速,比如我对AI大模型场景、区块链场景、网络传输场景,甚至对隐私计算场景,就可以把颗粒度做得更细。
还是拿车做类比,像宝马X5、奔驰GLE都是既兼顾舒适和运动性能,以及SUV的通过性等等,但我们做不到,而用RICS-V的好处就是我能用它做一辆硬派越野,还能用它做一辆纯都市的小轿车,甚至是纯都市的SUV,就把颗粒度变细了。对于不同的场景,我们争取在硬件层面做一些特定的优化,从而弥补整体方案上的不足。
那么怎样的条件能够助力这个进程呢?其实就关乎两个问题,一个问题是能不能有很多企业来做RICS-V芯片,最后演变成我们在软件层面上能不能更好的通用,把生态真正建立起来;
还有一点就是我们在不同场景下的需求能不能更爆炸,比如我们对大模型的需求、对车载自动驾驶的需求、对网络传输的需求等等,因为单一的需求很大,但其他需求很小,不太能够用单一的处理器给予足够的回报,但如果每个需求都变得很大,可能大家投入的芯片就会比较多,相当于群狼战术。大规模的效应一旦形成,对于我们而言,以整个面来打击一个点的方式在行业内形成相对竞争优势的概率也会大大提升。
幻实(主播):
还是需要大家一起来把这条赛道做热、做好。
梅迪(嘉宾):
没错,对于新能源车我特别有感触,当大家都使用电车的时候,如果充电桩是通用的,那么你就会发现买电车是一个正向的选择。
幻实(主播):
包括电池、标准、协议全部都是我们定义的。
梅迪(嘉宾):
对,会马上形成一个非常快速的迭代,我们也非常期待这个时间点的到来。
幻实(主播):
所以这里我们号召大家用RICS-V来解决算力的赶超难题也是一条可以考虑的路线,虽然它不见得像英伟达那么通用,但我们在具体情况下应该还是非常适合的。而且我觉得你们在和字节跳动的合作上应该也探索出了一些结论,我刚刚听您说你们已经交付了一些成果在上机了,效果如何?
2018-2025 RISC-V市场总收入(单位:百万美元)
(资料来源:半导体产业研究)
梅迪(嘉宾):
我觉得满足客户的需求没有问题,但客户或者说美国的NVIDIA在不停地迭代更新,所以我们能不能持续给客户提供比较好的价值是我们遇到的一个非常严峻的挑战,尤其是面对大模型带来的又一波冲击。因为以前的模型可能相对而言比较分散,所以在一些比较专用的场景中可能会更有优势。
而现在都收敛到一个大模型,所以也由分散转换为集合,而怎样能做得更好,对于我们来讲仍然是挑战,但我认为比较有机会、有信心的是目前人工智能包括大模型的应用,不光集中在互联网巨头这边的场景中,它还有很多其他场景可以做,我们可以把这些场景尽可能地都识别好,这样的话,一方面,我们的业务范围能够有所扩展,另外一方面,我们能通过理解不同的场景来迭代产品,最后回归到给所有客户提供一个比较好的价值。
大模型VS推理模型,中国更适合哪个?
幻实(主播):
听起来这是一件任重而道远的事情,其实开局做突破并不容易,现在大家都在说相较于大模型,其实中国更适合推理模型,您认同这个说法吗?从市场需求角度来看,您认为推理模型会带来巨大的需求吗?
梅迪(嘉宾):
如果把我们真正的需求分成两类,一类我们认为是面向普通老百姓的,或者说是To C的,那它的对象必然就是个人,需求是千人千面的,所以它的能力要求除了对话可能还有代码生成以及其他很多复杂的功能,而且还需要有信息的实时更新,比如今天发生的一些重要事件,明天可能在用户问答的时候就要体现在场景里。如果把这些因素都考虑进去,我们认为这个模型的规模一定会极大地膨胀,因为大家的需求能力也在不停地膨胀。我觉得在目前阶段,无论是国产的算法还是硬件都还很困难,因为它归根结底还是在拼各种各样的规模。
另外,您刚才问到这个推理芯片的需求是否会越来越大?我们可以看到在中国,应用的开发非常高效,坦白来说也比较友好,生活中有很多场景,包括政务场景、智慧城市场景、安防场景等等,那我们能不能用大模型的能力去赋能它呢?本质上,大模型的智慧体能力还是不错的,这里其实就不太需要非常强的实时信息,而且能力也比较单一。如果我们能发掘到比较好的不同场景,那就非常有可能只是推理的应用场景,只要用一些规模不大的大模型,再利用一些工程能力,就能做成应用进行推广。
移动互联网不是中国发明的,但中国却是全世界最大的用移动互联网来做支付、做物流,做各种应用的市场。我认为大模型能够针对不同的应用、不同的场景,蓬勃地成长起来的机会非常大。但是回到to C,我觉得还是属于少数几家大公司的市场。
全栈软硬件解决方案架构(图源:希姆计算官网)
幻实(主播):
所以工业级还有一些特殊的特种的,我觉得还是有机会的,这也是中国的优势。
梅迪(嘉宾):
没错,我们可以把应用做得百花齐放。
幻实(主播):
而且我们有数据的积累,数字化的时代我们已经赶上了,那么进入智能化的时代我们还是有先发优势的,至于消费级那些炫酷的的故事,我觉得也不是太影响生活,我也是很看好这个方向,其实我们大家只要抓住一些自己能够识别到的一些场景去做,还是可以诞生很多有意思的点。
梅迪(嘉宾):
没错,中国很多公司在用一些基础的能力做面向不同场景的应用开发上有非常大的创新能力,我也比较看好这方面。
幻实(主播):
没错,我们一起向着更智能的各个场景去期待、去努力。希姆已经起步了,而且已经有了一些初步的实验结果,也可以让更多的人关注RICS-V,用这种方式来解决算力的问题。
梅迪(嘉宾):
国家政治界、学术界的高层近来频繁有一些发声,我觉得还是非常高瞻远瞩的。
幻实(主播):
谢谢梅总和我们分享了这么多,也期待您之后再来做客芯片揭秘和我们分享希姆未来的发展。
近年来,随着全球对芯片自主可控需求的增长以及物联网、边缘计算等领域的需求不断扩大,RISC-V得到了广泛关注和应用,逐渐成为第三大指令集架构。在AI时代,RISC-V更是迎来爆发的新机遇,从物联网设备、边缘计算逐渐迈向AI计算、高性能计算等领域。
据RISC-V International统计,2022年全球采用RISC-V架构的处理器出货量超过100亿颗,仅用12年就走完了传统架构30年的发展历程,Omdia的报告预计,到2030年,RISC-V架构芯片的出货量将达到170亿,市场份额将占到25%,尤其在工业和汽车行业增长加快。这一预测也表明RISC-V架构正迅速获得市场认可,也意味着它或将打破长期以来由少数传统架构主导的市场格局。
在端侧AI算力芯片行业,RISC-V 架构芯片也具有显著的优势。其低功耗、低成本、灵活定制的特性,以及将AI算力融入通用算力的技术方案,能够满足边端侧对轻量AI算力的需求,应对应用场景碎片化的挑战。预计到2030年,全球RISC-V边端侧算力市场规模将达到270亿元,中国端侧算力市场规模将达到70亿元,复合增速为35%。但RISC-V要想实现更广泛的市场应用,还有许多挑战需要面对,但我们有理由相信RISC-V必然是未来道路中的一个重要选择,让我们拭目以待!
关于栏目
2018年至今,芯片揭秘连续5年以周更频率与200+科技企业合作,涉及领域包括:半导体、工业软件、智能汽车、材料装备、新能源等;在喜马拉雅FM上的芯片类节目中排名第1,科技类节目中排名前30,全网播放量超过450万。
五年来,芯片揭秘·大咖谈芯通过图文、视频、音频等内容收获超播放量1000万,芯片揭秘结合多元模式帮助合作企业立体宣传,实时关注合作伙伴的最新动态,与产业共同成长,与企业共创国潮芯生态。
点击图片可跳转至大咖谈芯声音合集,快来收听吧!
-END-
| |||
| |||
| |||
|
采访 | 幻实 编辑 心怡 | 审核 | 幻实
点击视频了解芯片揭秘↑
点击下方卡片,关注芯片揭秘
和我们一起透视半导体产业👇
欢迎把文章分享到朋友圈
【点赞+在看】喝彩硬科技