首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

极致性价比！Intel二代独立显卡正式发布：性能飙升12.5倍

科技 2024-12-03 23:51 广东

Intel今天正式发布了代号Battlemage的第二代锐炫B系列显卡，首发两型号锐炫B580、B570，而此时距离第一代A系列最初登场已经两年多了。

两款新品定位主流市场，主要面向2K超高画质游戏玩家，大致对标NVIDIA RTX 4060系列、AMD RX 7600系列。

因为根据Intel提供的数据，1080p在游戏玩家中的占比逐年递减，如今已经降至56％，2K分辨率则增长到了22％，预计到2026年即可实现反超。

这一代，Intel主打三个亮点：最佳性价比、XeSS 2、AI加速。我们会逐一和大家介绍。

新的Xe2架构在前代Xe基础上进行大量的优化改进，尤其是投入了大量精力对架构的兼容性和软件开销进行重构和优化。

Xe2不仅进一步提升了软件的适配性，还增强了架构的效率，提高了资源利用率，特别是减轻了软件对硬件的开销。

先来看一下两款新卡的公版规格，后边再讲架构和技术。

锐炫B580配备了20个新一代Xe2核心(分为5个切片)，对比上代A580反而少了4个核心与1个切片，同时有20个光追单元、160个XXM AI引擎。

不过，核心频率从1700MHz大幅提高到2670MHz，弥补了核心数量的不足，INT8算力性能从197 TOPS来到了233 TOPS，提升幅度约18％。

显存位宽从256-bit降至192-bit，但是容量从8GB GDDR6扩大到12GB GDDR6，等效频率也从16GHz提高到19GHz，因此带宽从512GB/s略微降至456GB/s。

整卡功耗190W，只增加了区区5W，从而大大提高了能效比，只需单个8针供电。

锐炫B570做了一部分精简，配备18个Xe2核心、18个光追单元、144个XMX引擎，核心频率略降至2500MHz，INT8算力性能203 TOPS。

搭配160-bit 10GB GDDR6显存，等效频率依然是19GHz，带宽380GB/s，整卡功耗仅为150W。

系统总线接口很遗憾并不是PCIe 5.0，而且从PCIe 4.0 x16砍半为PCIe 4.0 x8，当然对这种级别的卡来说影响可以忽略不计。

硬件解码支持AV1、HEVC(H.265)、AVC(H.264)、VP9、XAVC-H，但是不支持更新的VVC(H.266)。

视频输出支持HDMI 2.1、DisplayPort 2.1 UHBR 13.5——上代是DP 2.0 UHBR 10。

官方宣称，锐炫B580对比定位更高的锐炫A750，平均性能提升幅度可达24％。

特别是打开XeSS之后，提升更加明显，《堡垒之夜》甚至可达78％，《刺客信条：幻景》也能有56％。

对比竞品RTX 4060，平均领先幅度为10％，考虑到种种因素，可以大致视为二者基本在同一档次，和RX 7600也基本差不多。

没有达到之前预期的RTX 4060 Ti的水平，有点小遗憾。

不过无论对比RTX 4060还是RX 7600，锐炫B580的一个显著优势就是显存多了一半，在游戏中更不容易爆显存，运行AI负载时也更有余力。

这一次，Intel依然打造了官方公版，也就是限量版。

仍旧是双风扇、双插槽、黑色风格，重点优化了散热设计，背面有一半都做了散热格栅，风流更大，噪音也更低。

首批合作伙伴除了老朋友宏碁、华擎、蓝戟、撼与，还新增了两家，一是常年主打高性价比的铭瑄，二是新的傲世创科(Onix)。

各品牌普遍都做了双风扇、三风扇两种设计，除了宏碁暂时只有一款双风扇，傲世创科则都是双风扇。

锐炫B580显卡将于12月13日正式上市(12日晚评测解禁)，定价249美元起。

要知道，锐炫A750两年多前首发的时候，还是要289美元。

锐炫B570显卡则要等到明年1月16日才会开卖，定价219美元起。

其实，Lunar Lake即酷睿Ultra 200V系列处理器中已经率先应用Xe2架构的核显，也就是锐炫140V、锐炫130V，如今终于来到了桌面独立显卡，未来还会陆续进入笔记本独立显卡、车载方案、嵌入式方案等。

Intel表示，Xe2架构相对于初代，重点就是提升各方面的效率，包括更高的利用率、更好的负载分配、更好的软件开销等等。

同时，Xe架构诞生两年多来，Intel一直在努力完善驱动、游戏的生态支持，先后迭代了50多个版本的驱动，新游戏0日支持超过120款，游戏适配优化数量也比当初增加了2.5倍。

这就是Xe2的整体架构图，主体依然是渲染切片，这是整个SoC芯片的基本结构，配合指令前端、二级缓存构成一个整体，和第一代如出一辙，基本没啥变化。

每个渲染切片内包含4个Xe核心(计算引擎)、4个光追单元，以及4个采样器、几何单元、光栅单元、HiZ单元(层次Z)、两个像素后端等模块。

各个部分的具体变化，下边拆开来讲。

二代Xe2核心除了继续原生支持SIMD16指令，还增加了对SIMD32的支持，虽然不是原生，但执行SIMD32指令是没问题的，从而能够更好地分配计算资源，还支持64位原子操作。

每个Xe核心内部，包含8个512位的矢量引擎(XVE)、8个2048位的XMX引擎，比上代减少了足足一半，可能调度效率会更高、更灵活。

这一次，Intel为每个Xe核心加入了多达256KB容量的一级缓存、本地共享缓存(SLM)，大大减轻了对二级缓存的依赖。

XVE矢量引擎除了支持SIMD16/SIMD32，还支持矩阵扩展，包括INT2、INT4、INT8、FP16、BF16、TF32等数据类型，其中TF32是针对AI优化的数据格式还扩展了Math、FP64支持。

另外，它还支持三路并发，包括FP、INT/EM、XMX，指令调度和执行效率更高。

对比初代，XVE引擎现在更小巧(基本可以视为砍半)，应该也会更灵活。

光追部分，Intel也做了大刀阔斧地改进，整体结构没太大变化，但是规模和性能高得多，比如遍历流水线从2条增至3条、方盒相交增大1.5倍、三角形相交增大2倍、BVH(包围盒层次结构)缓存增大2倍来到16KB。

这样的规模当然远远没法和NVIDIA相比，甚至不如AMD，但提升也是相当明显的，应该能够达到基本可用的水平，当然更有赖于游戏的适配和优化。

媒体引擎包含两个相同的多媒体解码器(MFX)，但注意它和Lunar Lake里集成的核显媒体引擎略有不同，没有XMX硬件编解码单元，因此不支持VVC(H.266)硬解码。

这就是BMG-G21，二代锐炫显卡首发的GPU核心芯片。

它总共有5个渲染切片、20个Xe2核心、20个光追单元、160个XMX引擎、20个纹理采样器、10个像素后端，以及2个多格式X编解码器，还有多达18MB二级缓存、192位显存。

各家的GPU架构设计不同，所以核心规模不具备直接可比性，但如果将这些与NVIDIA GPU类比，那就相当于80个ROP光栅单元、160个TMU纹理单元。

这是因为，纹理采样器转换为TMU的比例是1:8，像素后端与ROP的转换比例同样是1:8。

按照Intel的首发，经过优化的第二代Xe核心，性能提高了70％，能效提高了50％。

而在一组微基准测试中，性能提升幅度最高可达惊人的12.5倍。

比如在《堡垒之夜》中，上图白线代表锐炫A系列，蓝线代表锐炫B系列，单位是毫秒，时间则越短越好。

锐炫A系列执行一帧渲染的时间为19.33毫秒，锐炫B系列则缩短到了13.01毫秒。

关键是，每一个渲染环节的效率都更高了，比如直接执行节省了1.1毫秒，间接执行节省了1.5毫秒等。

这也就证明，锐炫B系列的每一个地方都做了微架构优化，都可以节省渲染时间，从而提升渲染效率和性能。

随着图形技术的进步，单纯的渲染已经不足以反应GPU计算能力，也无法做到显著提升性能，AI渲染就越来越普遍。

XeSS就是Intel打造的AI超分解决方案，对标NVIDIA DLSS、AMD FSR，在较低分辨率的画面帧的基础上，提取运动矢量，使用超分辨率技术进行放大和加速，从而生成更高质量的图像。

官方号称，在2K超高画质游戏中，XeSS可以带来22-80％的性能提升，尤其是在光追等像素生成较为困难的场景中效果更明显。

经过不断努力，Intel XeSS已经有超过150款游戏支持，初具规模。

如今，XeSS终于升级为第二代，SR超分技术基础上增加了两项新技术：XeSS FG帧生成技术，提升画面质量与帧率；XeLL低延迟技术，提升响应速度。

XeSS FG帧生成技术的工作原理是：首先使用游戏引擎，原生渲染出第一帧和第二帧，然后通过插帧技术和AI算法，生成二者之间的中间帧并插入。

为了实现这一目标，Intel采用了两种技术，分别是光流重投影技术、运动矢量重投影技术，二者结合以确保插帧的准确性、画面的流畅性。

不过不同于NVIDIA RTX 40系列，Intel不需要单独的光流加速器硬件，至于是否支持NVIDIA、AMD的显卡还在评估。

目前暂时还没有支持XeSS FG帧生成的游戏，毕竟刚刚宣布，但是《F1 24》等游戏已经在积极开发集成，UE等游戏引擎也可以通过插件支持。

当然，XeSS SR超分、XeSS FG帧生成两项技术也是可以一起使用的。

XeSS SR渲染一个稍低分辨率的画面帧，并将它放大，在送到XeSS FG插帧里，实现帧率翻倍。

比如《F1 24》，可以看到XeSS 2的性能提升是非常显著的，远超初代XeSS。

2K超高画质下，锐炫B580的基准帧率为48FPS，开启XeSS 2质量模式就能提升至2.8倍，不但比初代XeSS高了超过65％，甚至超过了XeSS SR超高性能模式。

依次开启XeSS 2平衡模式、性能模式、超高性能模式，帧率还可以逐步提升，最终高达186FPS，是原生性能的几乎4倍。

介绍XeLL低延迟技术之前，先回顾一下PC游戏中的系统延迟怎么来的。

这个过程始于玩家点击鼠标的动作，一直持续到画面最终显示在屏幕上，这个过程所需要的时间，就是我们说的延迟。

具体来说，玩家操作的信号首先传递给CPU，随后进入一个称作渲染队列的环节，然后GPU将这些指令转换成屏幕上的像素，最后这些像素构成的图像呈现在显示器上。

整个流程中的每一步都可能增加延迟，累积起来就是我们在游戏中感受到的卡顿现象。

为了尽可能降低延迟，NVIDIA打造了Reflex技术，AMD则推出了两代Anti-Lag，现在轮到了Intel XeLL。

XeLL重点针对CPU渲染队列等待过程，基本消除了它，从而大大缩短了从鼠标点击到屏幕显示的整个过程。

Intel PresentMon工具已经可以显示具体延迟，方便玩家测量从鼠标输入到系统显示的整个延迟时间。

同时，Intel内部还开发了延迟测量工具(LMT)，基于微控制器的一款特殊设备。

实际性能如何呢？还是以《F1 24》为例。

原生渲染时，48FPS帧率的延迟是57毫秒，而在开启XeLL之后，延迟降低到了32毫秒，改善了多达45％。

更神奇的是，如果把XeSS SR、FG、XeLL低延迟全部打开，可以把延迟降至28毫秒，改善51％，同时帧率高达152FPS，提升2.17倍。

当然，也可以只开启SR、低延迟，此时延迟仅有19ms，改善足有67％，而帧率为90FPS，仍有原生渲染的接近2倍。

XeLL低延迟技术是基于驱动程序实现的，因此效果不是最好的，但很容易集成到游戏中。

首发支持的有《F1 24》、《漫威暗夜之子》、《刺客信条：幻景》等等，未来还会有更多加入。

AI，尤其是生成式AI，是如今GPU绕不开的话题，锐炫B系列也通过增强的XMX引擎，提供了更好的支持。

锐炫B580对比RTX 4060，运行常见的Llama 2、Llama 3.1、Mistral、Phi-3等大型语言模型，都有相当大的性能优势，最多领先约50％。

Intel之前还推出了一个免费的生成式AI工具AI Playground 2.0，专为Xe2架构而来(包括核显)。

它允许用户在本地端侧体验图像创建、编辑、AI对话等，下载模型即可体验，无需连接云端。

好的显卡，除了好的硬件架构技术，更离不开好的驱动，Intel也在持续完善，功能不断丰富，无论是图形设置、3D设置，还是超频，该有的都有。

说到超频，锐炫B系列当然也可以，而且更简单，在驱动中开启高级模式即可操作。

上图中，浅蓝色显示的是默认频率和电压曲线，玩家可以向上推动该曲线，从而提升频率，获得更高的性能。

玩家还可以使用电压偏移来改变电压，并访问更多电压点，这一切都实时可见。

电压、功耗都可以设置一定的最高阈值，确保安全超频。

以锐炫B580为例，默认状态下即可轻松超频200MHz；增加20％功耗可以再超200MHz；继续增加25％电压还能继续超200MHz。

当然，具体超频幅度和电压、功耗设置，取决于显卡的不同个体体质，以及散热等外部因素。

最后附上官方图赏：

共同研究探讨硬件知识及相关信息

最新文章

Intel废除纯粹64位架构x86S！酷睿Ultra 200S确认存在5大性能问题

锐龙7 9800X3D真实厚度仅仅40微米！93％都是无用之物

HAMR 17年研发终落地！希捷发布最大32TB硬盘可惜SMR

RTX 50支持全新AI渲染！还有DLSS 4、32GB GDDR7

见证历史！首款国产DDR5内存终于来了

雷克沙ARES DDR5-6000 C26内存评测：AMD平台最强挑战超频极限

中国特供版RTX 5090D公然现身！32GB GDDR7没跑了

世界上第一款通用微处理器！Intel 8080喜迎50周岁生日

新一代AI轻薄设计本！微星尊爵16 AI+锐龙版2024评测：轻薄之下亦有澎湃

台积电首次公开2nm：性能提升15％、功耗降低35％！但一块晶圆近22万元

两块Intel B580、一块Titan XP共处一室！36GB显存有奇效

蓝戟锐炫B580 Photon 12G OC显卡评测：甜点新玩家不止能玩游戏

AMD明确表态与Intel合并不可能！或许这才是Intel的结局

高通二代骁龙X Elite在路上了！野心大得不可思议

烤机比公版低8度还超静音！傲世追日B580 OC显卡评测：远强于4060

知情人士：美国将限制中国经第三国购买GPU AI芯片

生产力、游戏双重完全体！锐龙9 9950X新主板新系统重测：全面超越对手最强

大显存性价比碾压RTX 4060！Intel锐炫B580首发评测：光追性能远超AMD

酷睿Ultra 200S鸡血补丁可能要失望了：性能提升有限

600TB残酷写入测试！忆恒创源PBlaze7 7A40评测：强悍又低温的顶级企业级SSD

Intel酷睿Ultra 200S游戏性能飙升33%！

核显超过RTX 4060！AMD最强APU首次跑分

不止颜值！华硕Z890吹雪主板评测：300W性能释放内存一键提速

Intel 18A工艺良品率只有10％？其实算一算就知道了

已用国产设备造出3D闪存！长江存储：不会上市

全球独有AMOLED高刷屏！索泰ZONE掌机评测：好饭不怕晚

世界上最好的游戏CPU终于不缺货了！锐龙7 9800X3D将大批量上市

提升100倍！Intel制程工艺4大突破

Linux之父怒怼x86微架构级别：完全崩溃的垃圾

成立3个月就首发Intel显卡！终于知道他是谁了果然不简单

4块组近百TB NAS！希捷酷狼Pro 24TB硬盘评测：读写均超1000MB/s

不放弃独显 Intel下一代已定型！神秘品牌成立3个月就首发

锐龙7 8700G VS. i7-14700：AI大潮下谁是更出色的商用台式机处理器！

最好看、最强悍的Intel显卡！蓝戟锐炫B580发布：超频2850MHz

真没有旗舰！AMD官方实锤RX 8800、RX 8600系列

影驰RTX 4070 Ti SUPER金属大师Plus OC显卡评测：重量级玩家的重量级选择

美国拉黑140家中国半导体企业！我国立刻反制：管制出口美国

极致性价比！Intel二代独立显卡正式发布：性能飙升12.5倍

Intel CEO突然退休！Intel、AMD会合并吗？需翻越两座大山

技嘉X870 GAMING X WiFi 7魔鹰主板评测：亲民价格顶级体验

堪称史上最惨RTX 4090！为了提升5帧搞得面目全非

板卡大牌正式加入Intel显卡阵营！同步首发可能背插

12核心+64GB+2TB 9500元！第一款AMD Zen5 8.8寸小屏本预售

华硕ROG STRIX X870-A GAMING WIFI吹雪主板评测：美貌与实力并存纯白外表下235W稳定释放

锐龙9 9950X3D/9900X3D时间定了！完美兼顾 Intel只能仰望

战斗法师来了！Intel新一代独立显卡官宣、全球首次亮相

16核心龙芯3C6000即将发布！自研显卡9A1000明年上半年流片

全球第一款酷睿Ultra 200V掌机终于发布！32GB大内存、双雷电4

不需要“杀手级应用”！不满周岁的AI PC羽翼渐丰看七剑下天山

42GHz频率几乎翻倍！三星亮出最强GDDR7显存

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉