22年后再战高性能显卡市场 Intel Xe GPU架构详解:王之野望

时间 • 2025-06-20 03:44:06
支持
In
就是

22年后再战高性能显卡市场 Intel Xe GPU架构详解:王之野望

作为CPU界的王者,Intel对高性能GPU市场一直没有死心,1998年就推出了i740独显,12年后又推出Larrabee,22年后的今天又重燃战鼓,推出了XeGPU架构。

Intel重新杀入高性能GPU市场的传闻已久,并挖来了AMDRTG部门前主管、首席架构师RajaKoduri坐镇GPU业务,这次是否会不一样呢?

今天的2020年架构日上,Intel终于详细地解开了XeGPU的面纱,这里我们就来管中窥豹一探Intel历时多年重新打造的GPU架构。

对于Xe架构,我们之前的报道已经多次提到Intel对它的期望是希望用一种架构去满足多种使用场景,从笔记本到游戏卡再到高性能超算,都是Xe架构,推动GPU算力从万亿次(TFLOPS)向千万亿次(PFLOPS)迈进。

IntelXe架构总览:一种架构通杀四方、适应AI、云时代

对于XeGPU架构,官方的定义是“并行矢量矩阵架构”,已经突出了这个架构的特点,那就是高度并行,适合扩展多种场景。

XeGPU架构有三大重点——软件第一、并行第二,同时适应全新的工作负载,比如AI、视觉云计算等等,这也是Intel作为GPU后来的一个优势,研发GPU架构的时候可以不用照顾太多之前的积累,直接面向未来潜力巨大的场景,比如AI、云计算等等。

XeGPU希望用一个架构统一所有应用场景,不过实际情况还是很复杂的,不同场景对性能、功耗的要求不同,可以细分为集成+低能耗、中端、发烧级、数据中心/AI、HPC百亿亿次计算等等。

在这些细分场景中,Intel打造了三种不同的架构——XeLP低功耗、XeHP高性能、XeHPC,不过实际上已经扩展到了四种,后面会再详细说。

虽然有三四种不同的架构,不过Intel现在做的主要是两种——适用于HPC的XeHPC及低功耗的XeLP,后者适合核显、笔记本及低端独显,包括之前曝光最多的DG1显卡。

IntelXeGPU架构详解:EU、存储、AI、显示、视频单元全都改了

目前进度最好的还是XeLP低功耗版,XeGPU的结构介绍都是基于XeLP的,具体如下:

XeLP架构简单来说就是在提升FLOPS浮点性能的同时,还要考虑功耗,所以能效很重要,性能及能效兼顾。

提升性能就要提升计算规模,Xe架构在Gen11基础上全面提升了执行单元的规模,EU单元从IceLake处理器上的Gen11核显最多64个提升到了96个,每周期Texel纹理、Pixel像素渲染能力也从32、16提升到48、24,总体性能1.5倍于目前Gen11显卡水平。

考虑到Gen11的规模实际上已经是目前Gen9.5的2倍多,理论上TigerLake上的Gen12核显性能是现有核显的至少3倍。

能效方面,在同样的电压下,XeLPGPU的频率大幅提升,从之前1.1GHz左右提升到了1.7GHz,还有其他手段一起降低了功耗,能效也全面改进了。

下面就是Gen11与Xe架构EU单元的具体对比了。

存储单元方面,XeLPGPU的改变也不小,L1新增了数据缓存,并支持端对端压缩,L3缓存从Gen11的3MB大幅提升到16MB,同时GTI(GraphicsTechnologyInterface图形技术接口)带宽翻倍。

在AI上,Xe架构之前的GPU主要是支持FP32、FP16及Int16浮点,而XeGPU开始支持INT8指令,AI性能是FP32的4倍。

多媒体引擎上,XeGPU架构的解码、编码带宽翻倍,支持AV1加速,同时支持4K/8K60播放,还有HDR、杜比音效等等。

显示输出方面,XeGPU支持4屏扩展,支持双eDP,接口支持DP1.4、HDMI2.0、TBT4及USB4,并支持8KUHD输出,还有360Hz高刷、自适应Sync,全面达到顶级水平。

为何说软件第一?IntelXeGPU驱动及软件优化

前面提到XeGPU架构的时候,Intel第一个强调的是软件,很多人可能并不理解,实际上Intel这次是抓到重点了,软件支持是GPU最容易翻车的地方,Intel的核显GPU多年来理论性能不弱,但是游戏表现一言难尽,就是驱动和优化是最大的锅。

这次Intel对软件及驱动的重视终于提上来了,这也跟RajaKoduri本人的风格有一定关系,2013年他回到AMD的时候,当年AMD第一个改革的就是催化剂驱动,全面放弃之前的界面及设计,变成了现在的肾上腺素Adrenalin驱动。

在图形软件方面,不同场景下的GPU面对的挑战也是不同的,3D渲染、计算、多媒体、性能、稳定性等等都很重要。

在驱动及编译器效率上,XeGPU改变了调度设计,支持AI优化指令,降低了DX11中的驱动开销(overhead),减少了API延迟等等。

针对GPU优化,XeGPU可以自适应优化,在后台就最大化GPU性能。

XeGPU还支持了VRS可变帧率渲染,根据渲染场景的不同来选择降低或者提升渲染内容,之前在IceLkae的Gen11上首先应用了。

还有就是IGCC控制面板,这里面提供了不少游戏辅助弓箭手,包括截屏、锐化、直播等等,如果大家用过NVIDIA的GFE及AMD的RIS,就知道Intel这是在一比一的致敬两位对手了,这对游戏玩家来说也是好事。

最后就是游戏支持,这个才是考验GPU厂商的关键,目前已经得到英雄萨姆4、GRID、GearTactics、RingofElysium、ChvalryII等游戏支持的,这个只能慢慢来了。

IntelXeGPU产品线:XeLP首发三款、OneMoreThing惊喜亮相

在尾声阶段,来看看IntelXeGPU最终的产品线,目前主要是XeLP及XeHPC两个架构有结果,其中LP架构会有三款产品。

最快见到的TigerLake处理器上的Gen12核显,然后就是DG1,这个是针对移动内容创造者的,还有就是针对服务器的SG1,后两者规格应该差不多。

然后就是OneMoreThing了,前面说到了XeGPU有LP、HP及HPC三种,现在Intel又增加了一个选择——XeHPG,专门为发烧级游戏玩家设计的。

XeHPG最大的特点就是支持RT光线追踪,硬件光追这个未来游戏的最大卖点也追上来了,至此AMD、NVIDIA及Intel三家都明确了支持光追了。

现在XeGPU的架构就变成了XeLP、XeHPG、XeHP及XeHPC四大金刚了,未来会覆盖核显到HPC超算在内的多个场景。

最最后就是四款GPU架构的工艺及封装了,XeLP会使用Intel的10nmSuperFin工艺,XeHPG及XeHP则是增强版10nmSuperFin工艺,其中XeHP还会使用EMIB2.5D封装技术。

在往上,XeHPC的计算卡之前原定是7nm工艺首发,现在随着7nm延期,也退回到了10nmSuperFin工艺了,不过封装技术是最先进的Foveros及Co-EMIB。

总之,今天公布的Xe架构可以让大家过过瘾,然而这些东西依然是纸面上的,停留在架构上的,有关DG1显卡、HPG光追卡的最终规格、性能、价格、上市时间等信息还得等等,最快也要年底左右了