龙芯3号:国产CPU新篇章,自研之路势不可挡

财富   2024-10-15 19:40   北京  

点击 信创纵横 并设为星标⭐️ 及时获取最新资讯

编者按:本文详细剖析龙芯近一两年来最新的各个型号产品,展现其不断发展的性能与功能指标,为读者呈现一个全面、深入的龙芯画像。



编辑|信创纵横公众号(ID:xinchuangzh)
出品 | 安东工作室
作者|安东
转载|请注明出处
扫码加入“信创纵横”知识星球社群,获取更多信创+数字化相关资料


在数字化时代,CPU作为计算机的核心部件,其性能与稳定性直接关系到整个系统的运行效率与安全性。近年来,随着国产CPU技术的不断突破,龙芯作为其中的佼佼者,正逐步走向新的高度。


01

龙芯中科公司基本情况

龙芯中科技术股份有限公司(Loongson Technology Corporation Limited)成立于2008年,由中科院和北京市政府共同牵头出资,成立龙芯中科技术有限公司,旨在依托“龙芯”十余年的研发技术,将“龙芯”处理器研发成果产业化,总部位于中国北京市海淀区。龙芯中科致力于开发自主可控的高性能处理器芯片,提供面向服务器、桌面计算机、嵌入式系统等多种应用场景的CPU解决方案。公司以自主创新为核心,通过持续的技术研发和市场拓展,推动中国自主芯片产业的发展。龙芯中科致力于构建一个安全且可控的信息技术生态系统。公司专注于自主研发,推出了自主指令系统——龙架构,并不断优化和开发CPU、GPU及接口等关键软硬件IP核。龙芯中科不依赖于外部技术授权和供应链,从而在芯片的设计、生产以及基于自主指令系统的软件生态建设上提升了自主研发能力,保障了供应链的安全性,并形成了一个完整的自主技术体系。

龙芯中科的主要股东包括:


北京天童芯源科技有限公司是其第一大股东,截至 2024 年10月 15日,持股比例为 21.56%。中科院计算技术研究所控制的北京中科算源资产管理有限公司是第二大股东,持股比例为 19.32%。


北京天童芯源科技有限公司:员工持股平台,持股比例为 21.56%。


中国科学院计算技术研究所:作为龙芯中科的主要发起单位,拥有显著的股份比例。持股比例为 19.32%。


北京工业发展投资管理有限公司:作为战略投资者,为公司提供资本支持。持股比例为 6.44%。



02

龙芯产品体系


龙芯中科的产品体系涵盖多个系列,适用于桌面计算、服务器、嵌入式系统等多个领域,具体如下:


信息化类: 龙芯3A6000、龙芯3A5000、龙芯3C5000、龙芯3C5000L、龙芯3D5000、龙芯2K2000、龙芯7A2000、龙芯7A1000。


工控/嵌入式: 龙芯3A6000工业级、龙芯3A5000工业级、龙芯2K2000工业级、龙芯2K1500、龙芯2K1000LA、龙芯2K0500、龙芯2K0300、龙芯2P0500、龙芯1C103、龙芯1C102、龙芯1C101、龙芯1D100、龙芯7A2000工业级、龙芯7A1000工业级。


龙芯配套芯片: 龙芯8P80103/龙芯8P2050、龙芯8P63601、龙芯8P63602、龙芯8T41505、龙芯8T2305。



龙芯3A6000

主频

2.0GHz-2.5GHz

峰值运算速度

240GFlops

物理核数

4

逻辑核数

8

处理器核

64位超标量处理器核LA664;支持LoongArch™指令系统;支持128/256位向量指令;六发射乱序执行;4个定点单元、4个向量单元和4个访存单元

高速缓存

每个处理器核包含64KB私有一级指令缓存和64KB私有一级数据缓存; 每个处理器核包含256KB私有二级缓存;所有处理器核共享16MB三级缓存

内存控制器

2个72位DDR4-3200控制器;支持ECC校验

高速I/O

1个HyperTransport<br>  3.0控制器

其它I/O

1个SPI、1个UART、2个I2C、16个GPIO接口

封装

35mm×35mm<br>  BGA封装,1190个引脚

功耗管理

支持主要模块时钟动态关闭;支持主要时钟动态变频;支持主电压域动态调压

典型功耗

38W@2.5GHz



龙芯3A6000工业级

主频

2.0GHz

峰值运算速度

192GFlops

物理核数

4

逻辑核数

8

处理器核

64位超标量处理器核LA664;支持LoongArch™指令集;支持128/256位向量指令;六发射乱序执行;4个定点单元、4个向量单元和4个访存单元

高速缓存

每个处理器核包含64KB私有一级指令缓存和64KB私有一级数据缓存;每个处理器核包含256KB私有二级缓存;所有处理器核共享16MB三级缓存

内存控制器

2个72位DDR4-3200控制器;支持ECC校验

高速I/O

1个HyperTransport  3.0控制器

其它I/O

1个SPI、1个UART、2个I2C、16个GPIO接口

封装

35mm×35mm  BGA封装,1190个引脚

功耗管理

支持主要模块时钟动态关闭;支持主要时钟动态变频;支持主电压域动态调压

典型功耗

28W@2.0GHz

龙芯产品谱系介绍

1. 龙芯1号系列


龙芯1C102:

应用场景:智能门锁类产品、电动助力车、跑步机等场景。

特点:集成多种功能模块,具有高稳定性和低成本特点。


龙芯1C103:

应用场景:高性价比的常见电机应用场景,如筋膜枪、修枝机、电锯等。

特点:支持多种通信模块和电机驱动,适用于各种电机应用场景。


龙芯1D100:

应用场景:产品主要应用于超声波水表、热表和气表 测量专用场景。

特点:集成超声波测量、温度测量等功能模块。


2. 龙芯2号系列


龙芯2K0500:

应用场景:工控互联网应用、打印终端、BMC等。

特点:高能效比、集成丰富的外设接口。


龙芯2K1000LA:

应用场景:交换机、边缘网关、工业防火墙等。

特点:高性能处理器核,集成多种接口。


龙芯2K2000:

应用场景:多场景工控互联网应用。

特点:通用64位双核SoC芯片,集成丰富的接口和安全模块。


3. 龙芯3号系列


龙芯3A5000:

应用场景:个人计算机、服务器。

特点:64位四核通用处理器,支持高性能桌面与终端应用。


龙芯3A6000:

应用场景:高端嵌入式计算机、桌面、服务器。

特点:64位四核处理器,支持同步多线程技术。


龙芯3C5000:

应用场景:服务器市场。

特点:64位十六核处理器,支持高性能计算和多路互联。


龙芯3D5000:

应用场景:高端服务器。

特点:64位三十二核处理器,集成安全可信模块。


4. 配套芯片


龙芯7A1000:

应用场景:服务器及个人计算机。

特点:配套龙芯3号处理器,提供多种外设接口。


龙芯7A2000:

应用场景:服务器及个人计算机。

特点:集成自研3D GPU,支持多种显示和网络接口。


龙芯 7A2000 是面向服务器及个人计算机领域的第二代龙芯 3 号系列处理器配套桥片。龙芯 7A2000 在第一代桥片7A1000 的基础上进行了优化升级。首先PCIE、USB 和 SATA 均升级为 3.0;其次显示接口升级为 2 路 HDMI 和1路 VGA,可直连显示器;另外内置一个网络 PHY,直接提供网络端口输出;此外片内首次集成了自研GPU,采用统一渲染架构,搭配32位DDR4显存接口,最大支持16GB显存容量。


03

龙芯最新产品盘点

(一)龙芯3B6000:计划在2025年推出样片

龙芯3B6000是龙芯中科技术股份有限公司计划在2025年推出样片的一款高性能处理器,采用新一代CPU核心,同频性能相比LA664架构的龙芯3A6000大幅提升20%左右,使用国产成熟工芯制造,主频不低于2.5Ghz。SPEC06 int性能超过50分,已经接近X86 CPU主流水平。这样的性能表现,使得龙芯3B6000已经完全能够满足日常使用和普通游戏的需求。


SPEC06 int有将超过50分,这个性能已经接近X86 CPU主流水平,已经完全能够满足日常使用和普通游戏了。这是在制造工艺落后情况下取得的成绩,如果与国外CPU使用相同制造工艺,龙芯的性能还有可能有所增加。另外,龙芯3B6600还集成GPU LG200,支持DDR5内存、PCIe 4.0总线、HDMI 2.1。


龙芯3B6000基于全新的LA664处理器核,支持LoongArch™指令系统,这是龙芯自主研发的指令集,支持128/256位向量指令,六发射乱序执行,具备强大的处理能力。处理器核包含64位超标量设计,支持多线程技术,能够更高效地处理多任务和高并发计算。


在缓存设计方面,龙芯3B6000每个处理器核包含64KB私有一级指令缓存和64KB私有一级数据缓存,所有处理器核共享16MB三级缓存,这样的缓存设计能够有效提升数据处理速度,减少延迟。


内存控制器方面,龙芯3B6000配备了2个72位DDR4-3200控制器,支持ECC校验,这不仅可以提高数据传输的可靠性,还能有效提升系统稳定性。


图片来源于:铁君公众号

(二)龙芯3C6000:高性能、高互联性的新标杆

龙芯3C6000是龙芯家族中的一款重磅产品,它首次引入了龙链1.0技术,这一技术类似NVIDIA的NVLink,可以支持2-8颗硅片间的互联,理论上可以达到128核心256线程。这一突破性的设计不仅大幅提升了处理器的并行处理能力,还为其在高性能计算、大数据分析等领域的应用奠定了坚实的基础。

在核心方面,龙芯3C6000采用了升级版的LA664内核,相对于前代产品3A6000,其IPC(指令每周期)性能有了显著提升。制造工艺方面,虽然具体数值未公开,但可以预见的是,随着工艺的不断进步,龙芯3C6000的性能将进一步提升。同时,它配备了16核心32线程的配置,使得在处理多任务时能够游刃有余。目前,龙芯3C6000处于样片阶段并即将在2024年4季度推出。

图片来源于:铁君公众号

(三)龙芯3D6000:双芯片封装,打造极致性能

龙芯3D6000则是一款采用了双芯片封装技术的产品,这种“胶水”封装方式使得它拥有了32核心64线程的强大配置。这一设计不仅大幅提升了处理器的计算能力,还为其在高性能服务器、数据中心等领域的应用提供了有力的支持。同时,双芯片封装也带来了更好的散热性能和稳定性,使得龙芯3D6000在长时间高负荷运行下依然能够保持出色的性能表现。


(四)龙芯3E6000:即将发布,期待满满

除了龙芯3C6000和龙芯3D6000外,龙芯还透露了龙芯3E6000的信息。虽然目前关于这款产品的具体信息较少,但从龙芯一贯的产品定位和技术实力来看,龙芯3E6000有望在性能、功耗、稳定性等方面实现新的突破。这款产品的发布将进一步丰富龙芯的产品线,满足不同领域、不同用户的需求。

根据官方消息,龙芯3C6000、龙芯3D6000可以对标至强银牌4314、至强金牌6338。在3B6000通过验证之后,龙芯就将推出32个和64个核心的3D7000和3E7000。

04

龙芯优势与劣势分析

龙芯中科通过多年的技术积累和创新,已经在国产CPU技术体系上构建起一系列显著优势:


优势一:开发了完全自主知识产权的指令系统——LoongArch。这一指令系统不仅提升了龙芯CPU的核心竞争力,还确保了技术自主可控,减少了对外部技术的依赖。LoongArch支持多种操作系统和应用,能够在复杂计算任务中提供高效的处理能力。


优势二:龙芯中科掌握了高性能处理器微架构设计技术,包括乱序多发射流水线、物理寄存器堆重命名、高精度分支预测器、256位向量运算部件、多访存部件、多级高速缓存、硬件数据预取等。这些技术的运用使得龙芯CPU在执行效率上与国际主流微处理器相当,有效提升了处理器的整体性能。


尽管龙芯中科在国产CPU领域取得了显著的进展,但在技术体系上仍然存在一些劣势,这些劣势一定程度上影响了其竞争力:


劣势一:与国内其他领先的信创芯片企业如海光、兆芯、鲲鹏、珠峰等高端处理器相比,龙芯CPU在单核性能、主频以及功耗效率方面仍存在一定差距。这影响了其在高性能计算和服务器市场的竞争力。另外,与国际领先企业相比,龙芯CPU的技术迭代速度相对较慢,这影响了其在快速变化的市场中的竞争力。



兆芯去年底发布的最新一代KX7000系列有了很大进步,它采用Chiplet互连架构,内部由一颗CPU die与一颗IO die构成。CPU die中包含了8个世纪大道微架构核心,并且跟同核心数的锐龙一样拥有4MB的二缓和32MB的三缓,可以提高性能,降低功耗,这是一种非常先进的技术,就连intel、AMD的最新款都在用。


兆芯KX-7000基于x86架构、32MB高速缓存、支持主流DDR5、PCIe 4.0、USB4等接口,原生支持Windows系统。这些最新指标都是国际领先水平,让人眼前一亮。而且兆芯KX7000系列有8个高性能核心,最高频率达到了3.7GHz,这是国内自研处理器的最高记录,频率越高代表性能越强,龙芯只有2.5GHz,已经被甩了一大截。


劣势二:由于龙芯CPU使用的是自主研发的LoongArch指令集,这导致其在软件生态上相对受限。虽然可以运行Linux系统,但在Windows环境下的应用支持有限,这限制了其在更广泛市场的应用。这主要是由于其与成熟的x86和ARM生态系统相比,龙芯的生态建设还处于发展阶段,软件和硬件的配套支持、开发工具的完善度等方面还有待加强。


B站有UP主进行过测试,在KX-7000搭配A卡运行赛博朋克2077、3A原神、CS2、战争雷普等4款游戏过程中,不会出现任何的BUG或者不兼容的情况。除了游戏应用,主流的工作软件,包括PS、PR、达芬奇和剪映,KX-7000都能正常预览、编辑和导出,且导出时能正常调用独显的编解码器,未出现任何报错。有up主还测试了三维软件C4D,以及IDE软件PyCharm和Visual Studio Code,KX-7000同样没有任何问题。上述是在Windows环境下,UP主还在KX-7000上体验了银河麒麟和统信UOS国产操作系统,整体完成度也很不错。惠普打印机,通过网线一键安装驱动,在WPS中能正常调用。微信等常见应用也能在银河麒麟系统下正常使用。通过Wine转译,甚至可以在银河麒麟系统中运行Windows应用,甚至还能用KX-7000在银河麒麟中安装Steam运行3A游戏。而这些应用软件要想顺利流畅便捷地运行在龙芯上,对龙芯来说还有待加强。


劣势三:虽然龙芯在自主指令系统上取得了突破,但其CPU的生产制造仍然依赖于外部工艺,如使用12nm工艺。这限制了其在制造工艺上的自主性和先进性。当然,这个劣势其他国产CPU也普遍存在。此外,龙芯在GPU领域的发展相对滞后,目前尚未推出具有市场竞争力的高性能GPU产品,这限制了其在图形处理和AI计算领域的应用。


劣势四:龙芯CPU在遵循国际技术标准和技术兼容性方面还有待加强,这影响了其在国际市场的推广和应用。并且由于品牌和市场推广的原因,龙芯CPU在市场上的知名度和占有率相对偏低,信创客户在选择CPU时可能会优先考虑其他知名信创品牌。


尽管存在这些劣势,龙芯中科依然在持续投入研发,努力提升其CPU的性能和生态兼容性,以期在未来市场中取得更大的突破和成功。


往期回顾


兆芯KX-7000:最易上手的国产 CPU,兼容多系统,畅玩3A游戏!




安东简介:
“信创纵横”、“信创咨询”、“新型基础设施建设”公众号创始人,专栏作家;北京市人社局评定高级工程师、评标专家;中国工程咨询协会认证注册咨询工程师(投资);广州信创行业协会、太极信创研习院“信创咨询规划”课程特邀讲师;本硕分别毕业于北京交通大学计算机、系统工程;先后就职于多家央国企总部,在信创产业及政策、数字政府、智慧城市及智能交通等领域从事咨询研究多年;欢迎交流合作!微信号:andon90
2

福利

定位:这是本人精心创建的知识社群,方向主要包含信创、数字化、新基建、智慧城市、以及AI、大数据等新一代信息技术,希望将该知识星球打造为一个大家频繁沟通、咨询与探讨行业问题的平台!与行业精英为伴。

同时,会提供大量高价值的在线培训及视频回放,并免费给大家提供一些解决方案/行业报告/PPT模板/电子书等干货素材【目前5000+,并实时更新】,供大家交流、学习以及自我提升。

欢迎加入信创纵横知识社群扫下方二维码





END


点击图片查看完整内容


信创纵横
致力于传播自主可控的硬核产品和信创安全方案,加快实现高水平科技自立自强。信创纵横公众号系ICT产业头部自媒体,由安东先生创办。再小的个体也有自己的光芒,欢迎垂询合作!
 最新文章