大会上,瀚博半导体推出了瀚博全新VGX VA16 AIGC大模型训推一体机方案,单机配备2TB超大显存支持高达405B参数大模型的微调和高达万亿参数的MoE大模型推理,支持麒麟、统信、龙蜥、OpenEuler 等国产OS ,为国内企业支持大模型部署提供一站式独立训练推理解决方案,为对话式AI、内容创作、文本总结与审核、数字人播报等应用场景提供了强大的算力支持。
瀚博半导体同样是国内的GPU独角兽企业,凭借自主原创架构,已完成两代GPU芯片。
1、发展历程
1995年硅谷半导体行业进入热潮中,刚从美国爱荷华大学计算机工程硕士毕业的钱军毅然投身其中,加入当时的芯片巨头思科。在思科工作的12年里,他参与了多个与存储和网络相关的芯片项目。
2009年,钱军离开思科,转而加入了AMD,并参与了「北方群岛」系列GPU的设计工作。在AMD期间,他结识了张磊,并共同深度参与了多个GPU项目。
2011年,钱军被AMD外派到中国,并把AMD的中国团队从几十人的团队发展到近400人的团队。在这个过程中,他看到国内的芯片设计能力、理念、人才在不断发展,也产生了创业的想法。
看到AI的机遇,也有了在国内建立芯片公司的契机。
2018年12月,钱军和张磊在上海创立了瀚博半导体,并在北京和加拿大多伦多设有研发分部。
作为GPU领域的资深专家,钱军和张磊创业后选择了DSA架构而非GPU架构作为他们自研IP方向。
钱军认为,鉴于英伟达的GPU软件已经经过多代迭代并极为高效,初创公司要设计一款能与之竞争的GPGPU架构芯片,没有三五代的迭代和软件优化,很难达到类似的效率。此外,与成熟大公司相比,初创公司在工程能力上也存在不足。
DSA架构的优势在于,其设计本身就能实现超过GPU 10倍的性能。
即便考虑到制程和软件效率的限制,DSA架构的AI芯片在AI推理方面的性能仍能达到GPU的3-5倍,使其具备与GPU及其他AI芯片竞争的实力。
专业的创始人和团队使得瀚博半导体得到资本的青睐——2019年,瀚博半导体很快获得真格基金、耀途资本和天狼星资本的天使轮和Pre-A轮融资。2020年更是获得快手在内的A轮5000万美元融资。
2020年5月,瀚博半导体成功流片了其首款7nm半定制芯片。
2021年6月,SV100系列芯片经过测试并成功点亮。
同年,在世界人工智能大会上,公司正式发布了其首款云端通用AI推理芯片SV100系列及VA1通用推理加速卡。
2021年4月,瀚博半导体宣布完成了5亿元人民币的A+轮融资,由中国互联网投资基金和经纬中国联合领投,原有股东继续跟投。到了同年12月,公司又完成了16亿元人民币的B轮融资,正式跻身独角兽企业行列。
瀚博半导体并未因此满足,持续推进技术创新。
2022年9月,在世界人工智能大会上,公司发布了四款新产品:瀚博统一计算架构、AI推理卡载天VA10、边缘AI推理加速卡载天VE1以及瀚博软件平台VastStream的扩展版。
同时,公司宣布进军GPU领域,并揭示其第二代GPU芯片SG100,该芯片将应用于图像渲染、视频和「元宇宙」等领域。
2023年7月,瀚博半导体在世界人工智能大会上正式发布了第二代GPU SG100,并推出了南禺系列GPU加速卡,标志着公司正式进入GPU市场。
2、团队构成与专业背景
瀚博半导体的团队由来自AMD、英特尔和华为等著名公司的资深工程师组成,平均拥有超过15年的相关芯片与软件设计经验。公司在北京、深圳和多伦多设有研发分部,核心员工人数超过500人,研发人员占比90%以上,且硕士及以上学历占比超80%
钱军——创始人兼CEO
钱军,瀚博半导体创始人兼CEO,本科毕业于上海交通大学,硕士毕业于美国爱荷华大学计算机工程专业,拥有25年以上高端芯片设计经验,以及40多款芯片设计和量产的经验。
钱军从1995年开始在美国思科工作,先后参与了存储、网络相关的多个芯片项目。2009年出任AMD高管,全面负责GPU(图形处理器)芯片的设计和生产;曾带领AMD中国团队设计量产了业界第一颗7纳米图形处理器和第一颗 7 纳米GPGPU架构的AI芯片。
张磊——联合创始人、CTO兼总架构师
张磊,瀚博半导体联合创始人、CTO兼总架构师,毕业于加拿大滑铁卢大学电子工程专业,之后在多伦多大学获得计算机工程硕士学位,在芯片和IP架构设计领域拥有超过23年的丰富经验,是 AMD 视频、人工智能、深度学习、SoC 和系统架构等专业领域的专家。
张磊在创立瀚博半导体之前,曾在多家知名科技公司担任重要职务。先后担任惠普数字照相机芯片设计师、AcceLight Networks首席通信芯片和系统架构师、M3 Technologies Inc多媒体视频芯片总架构师。2004年,张磊任职于ATI / AMD公司,负责视频、人工智能、深度学习芯片领域,在上述领域持有 40 多项核心专利,并被AMD授予最高级别技术专家(Fellow、院士)称号。
3、主要业务
瀚博半导体致力于为智能核心算力和图形渲染提供全栈式芯片解决方案,拥有自主研发的核心IP和两代GPU芯片,适用于通用AI计算和图形渲染。
其产品线包括云端通用AI推理芯片、AI加速卡、高性能AI推理加速卡等,这些产品被广泛应用于数据中心、边缘计算、智慧城市、智能安防、智慧教育、智能医疗等领域。
(1)GPU芯片
SV100系列芯片(第一代GPU芯片)
瀚博SV100系列是超高性能人工智能与视频处理芯片, DSA架构使得SV100系列在特定应用方向上比传统GPU更具性能优势,特别是在视频处理和AI推理任务中,能够提供更高的效率和更低的延迟。
SV102是瀚博SV100系列的首款芯片,发布于2021年,基于瀚博自主研发的通用DSA架构,支持FP16、BF16和INT8等数据格式,单芯片INT8峰值算力超200 TOPS。相同功耗下,SV100可实现数倍于当时主流数据中心GPU的深度学习推理性能指标,具有超高吞吐率、超低延时的特性。
SG100系列芯片(第二代GPU芯片)
瀚博SG100系列芯片采用7nm先进制程,具备业界领先的渲染性能,同时兼具低延时高吞吐的AI算力和强大的视频处理能力。
SG100系列芯片搭载瀚博自研GPU软件栈,业界一流的SR-IOV硬件虚拟化技术,支持Windows/Linux下的DirectX 11、OpenGL、Vulkan等API接口,支持H.264、H.265、AV1等多种视频编解码格式,可广泛支持数字孪生、数字人、云桌面、云手机、云游戏、云渲染、工业软件等多领域应用,助力打造元宇宙产业算力底座。
统一计算架构VUCA
VUCA架构是瀚博半导体在WAIC会议上正式推出的一款统一计算架构,整合了多款高性能计算引擎,拥有高效统一的存储管理、一致性接口和低链接延迟、完整的虚拟化功能、统一的底层软件设计、模块化的上层计算算子库和功能模块。
(2)载天系列加速卡
瀚博半导体基于公司的两代GPU SV100和SG100,设计并推出了载天系列加速卡。
载天VA1
载天VA1是瀚博半导体第一款AI加速卡产品,与SV102同期推出。
载天VA1基于SV102芯片设计,专为云端和边缘智能应用而开发。VA1实现实时高能效深度学习推理,在ResNet-50基准测试中,是英伟达T4吞吐量的2倍以上。
在视频处理方面,VA1支持64路以上H264、H265或AVS2 1080p解码,分辨率支持高达8K。VA1主要面向云服务器和数据中心。
载天VA10
载天VA10在2022年世界人工智能大会上发布,基于SV100系列AI芯片,采用全高3/4长单宽PCIe Gen4接口,适合AI服务器高密度部署。
VA10的峰值算力为400 TOPS(每秒万亿次运算),功耗为150瓦,其推理性能是同功耗当时主流GPU的两倍以上,延时仅为后者的6%。
此外,载天VA10还具备高密度编解码能力,能够支持100路1080P 30帧的编解码转码,适合多种需要高实时性的云端AI应用部署。
载天VA10适用于需要高实时性的云端AI应用,主要面向AI推理和视频处理等应用场景。
载天VE1S
载天VE1S是一款面向边缘大算力场景的AI推理加速卡,主要应用于智慧交通、车路协同、工业质检等复杂场景。
该产品具有超低时延和超高吞吐率的特点,其吞吐量是主流GPU的两倍,而最高吞吐量下的时延仅为GPU的1/5。在功耗方面,载天VE1S在40-65瓦的功耗下,INT8峰值算力可达100 TOPS,并支持60路1080P视频实时解码。
(3)载天系列智能视频加速卡
载天VA1V
载天VA1V是瀚博半导体推出的一款智能视频加速卡,属于载天系列智能视频加速卡之一。
单卡提供200+ TOPS(INT8)与80路1080p 30帧/秒的视频解码能力,具有2路 8K HDR @60+FPS 编码/转码,实现超高性能并发视频转码。
载天VE1V
载天VE1V是瀚博半导体推出的一款边缘AI推理加速卡,属于载天系列智能视频加速卡之一。
该产品主要面向需要大算力的边缘计算场景,如车路协同、低速自动驾驶(无人配送车、港口物流园区无人驾驶车辆)等。
(4)南禺系列数据中心显卡
瀚博半导体在2023世界人工智能大会上发布南禺系列GPU产品,南禺系列包括三款产品:VG1600、VG1800和VG14,这些产品采用SG100芯片,分别针对不同的应用场景进行了优化。
VG1600:这款加速卡结合了渲染与视频处理能力,旨在为云游戏提供沉浸式体验,使玩家能够享受更真实的游玩场景。
VG1800:专为远程工作设计,VG1800能够流畅支持各类办公软件、教育APP和工业设计软件,提供出色的云桌面用户体验。
VG14:这是一款支持Windows操作系统的国产工作站显卡,能够胜任多任务处理和大型专业软件运行等多元办公场景。
南禺系列的推出,旨在全面覆盖云端及桌面应用,为高质量内容生产提供高效的算力支撑。这些产品不仅适用于云游戏和云桌面,还能够满足工作站的需求,从而为瀚博半导体在AI大模型、图形渲染和高质量内容生产领域提供完整的解决方案。
4、估值及融资情况
瀚博半导体目前完成8轮融资,历史融资额超25亿元人民币,融资情况如下:
天使轮融资:2019年3月,瀚博半导体获得天使轮融资,金额未披露,投资方为真格基金。
Pre-A轮融资:2019年7月,瀚博半导体获得Pre-A轮融资,金额未披露,投资方为耀途资本、天狼星资本。
A轮融资:2020年11月,瀚博半导体获得A轮融资,金额为5000万美元,由快手,红点创投中国基金,五源资本(原晨兴资本)联合领投,赛富投资基金和所有现有股东(包括真格基金,天狼星资本和耀途资本)跟投。.
A+轮融资:2021年4月,瀚博半导体获得A+轮融资,金额为5亿元人民币,由中国互联网投资基金和经纬中国联合领投,现有股东红点创投中国基金、五源资本、赛富投资基金、耀途资本、天狼星资本和元木资本跟投。
B-1和 B-2轮融资:2021年12月,瀚博半导体获得B-1和 B-2轮融资,金额为16亿人民币,由阿里巴巴集团、人保资本、经纬创投和五源资本联合领投,国寿科创基金、Mirae Asset (未来资产)、基石资本、慕华科创基金(清华产业背景),以及老股东红点中国、耀途资本和元木资本跟投。
C轮融资:2024年6月,瀚博半导体获得C轮融资,金额未披露,由老股东阿里巴巴、经纬创投、红点中国、五源资本、耀途资本和未来资产投资。
C+轮融资:2024年9月,瀚博半导体获得C+轮融资,金额未披露,由中网投、赛富投资基金、招商资本、经纬创投、国寿投资、基石资本和慕华科创投资。
5、小结
瀚博半导体的创始团队和核心成员主要来自AMD,他们以自研IP为核心,成功推出了两代GPU芯片和AI加速卡产品。
作为国内GPU制造商中能够实际交付产品的企业之一,瀚博半导体在经历了两年的融资空隙后,今年连续完成了两轮融资,其未来发展值得期待。
- END -