新玩家入场！英特尔正式推出锐炫A系列移动端独立显卡-笔记本专区

新玩家入场！英特尔正式推出锐炫A系列移动端独立显卡

作者：姜惠田编辑：姜惠田 2022-03-31 14:54 IT168网站原创

　　2022年3月30日，英特尔今日宣布推出面向笔记本电脑的英特尔锐炫™ 独立显卡系列。这是英特尔锐炫 A 系列显卡产品组合中率先发布的独立显卡。所有搭载英特尔锐炫 A 系列独立显卡的产品均基于英特尔全新 Xe HPG 微架构而打造，专为游戏玩家和内容创作者量身设计。此外，英特尔公司也表示将于今年发布面向台式机和工作站的产品。

　　此次推出的英特尔锐炫 A 系列独立显卡将应用于广泛的移动设备中，其中多款搭载锐炫 3 系列显卡的首批机型还将通过英特尔 Evo™ 平台认证，并采用英特尔最新第 12 代酷睿处理器，包括针对超薄本设计的 A350M 以及为兼顾性能和轻薄而设计的 A370M，同时还兼具 Wi-Fi 6、即时响应和超长续航等特性。

　　英特尔公司副总裁兼显卡与游戏团队总经理 Roger Chandler 表示，“数十年来，英特尔一直致力于推动 PC 平台的创新。通过推出历代 CPU 处理器，我们为全球数十亿用户提供了强大的计算能力。我们通过 USB、Thunderbolt™ 和 Wi-Fi 等特性不断推动连接技术的演进，并与 PC 生态系统合作开发突破性的 PCI 架构、推出英特尔 Evo™ 平台，不断拓展移动设备的更多可能性。英特尔在推动 PC 平台创新方面拥有得天独厚的优势，旨在满足全球商用用户、消费者、游戏玩家和内容创作者对于算力日益增长的需求。”

　　据英特尔表示，此次推出的英特尔锐炫 3 系列独立显卡能够提供 1080p 主流游戏和内容创作体验。在运行多款热门游戏时，搭载锐炫 A370M 的笔记本电脑可以提供 1080p @60fps 以上的画质。英特尔锐炫 5 系列和锐炫 7 系列均可提供领先的内容创建性能，以及更强大的图形与计算性能。与锐炫 3 系列相比，锐炫 5 系列和锐炫 7 系列内置更多 Xe 内核、更多光线追踪单元和更高 GDDR6 显存。

　　据悉，首款搭载英特尔锐炫3系列独显的笔记本电脑——三星Galaxy Book2 Pro已于海外市场上市，搭载锐炫5和锐炫7系列显卡的笔记本以及面向台式机的英特尔锐炫 A 系列显卡的产品，预计在今年夏天上市。

　　基于Xe HPG微架构设计

　　搭载英特尔锐炫 A 系列独立显卡的产品均基于英特尔全新 Xe HPG 微架构而打造，提供了出色的性能、能效和可扩展性。Xe HPG 微架构包括了强大的 AI引擎和支持下一代编解码器标准的增强媒体引擎。除此以外，还有下一代Xe显示引擎和新的图形管线，用来处理各种不同的显示任务。

　　在Xe HPG微架构里，每4个 Xe内核组成了一个渲染切片（Rendering Slice）。每一个Xe内核中都配备了数量可观的运算单元，比如矢量引擎 XVE，矩阵引擎XMX。此外Xe-HPG也集成了其他主流的图形技术，比如网格着色，采样器反馈等。Xe HPG架构最大的特点就是灵活性，通过叠加渲染切片来构建不同的SOC，最小两个，最大八个。这样的结构最主要的特点就是可扩展性很强，根据渲染切片数量的不同，可以打造更丰富的产品线，为用户提供更多选择。

　　与上一代的 Xe LP微架构相比，Xe HPG 微架构的每瓦性能提升了1.5倍。此外，渲染切片还支持DX12 Ultimate，其中包括对所有图形固定功能块的改进，当然还有支持微软DXR 和 Vulkan RT 的专用硬件光追单元。每个切片还配备了四个硬件光追加速器，用来支持实时的光线追踪技术，能够显著的提升3A大作的游戏画面和光影效果。

　　Xe Core核心方面，现在Xe内核已经取代了此前集成显卡架构中EU的概念，成为了Xe HPG架构中最基础的执行单元。它包括16个256位宽的 SIMD 矢量引擎，并为传统图形着色器执行大部分的运算。矢量引擎主要负责传统图像处理的计算任务。由于AI的算法核心几乎完全围绕着一系列大型的矩阵乘法和累加算法，在每个 Xe 内核中构建了专用的矩阵引擎，来进行硬件加速。Xe内核包含16个矩阵引擎，每个引擎都是1024 位宽。矩阵引擎就是为了加速AI运算用的。为了满足矩阵、矢量和光线追踪单元的高带宽需求，在每个Xe内核中构建了一个192KB 的大型本地内存，它可以根据每个工作负载的需要在L1缓存和共享本地内存(SLM) 之间动态分配。

　　其中矩阵引擎的一个主要应用是在实时渲染过程中使用 AI。这一算法称为XeSS，它是一种超级采样技术，与传统的高分辨率渲染相比，可在游戏中提供更高的性能。它使用神经网络辅助运动矢量，从低分辨率渲染中生成精美的高分辨率图像。英特尔还展示了14款支持XeSS技术的游戏，并表示未来将继续深化与顶级游戏工作室的合作，以增加对这种强大并开放的 AI 超分技术得到广泛的使用，为游戏玩家提供更好的游戏体验。

　　两种不同的芯片设计

　　英特尔锐炫 A 系列独立显卡的芯片代号有两个——ACM-G10和ACM-G11。ACM-G10包含多达32个Xe内核和光追单元，16MB的L2缓存，256位GDDR6接口，16路PCIE4接口；ACM-G11包含多达8个Xe内核和光追单元，4MBL2缓存，96位显存接口，8路PCIE4. 两种芯片设计都包含两个Xe多功能编解码引擎，和4路显示输出引擎。

　　在芯片设计中，频率是必不可少的一个因素。但是，频率的提升会要求电压的升高，从而带来功耗的增加。通过实时监控独立显卡的性能指标，例如功耗，温度和使用率，并且动态调节时钟频率来与之适配。此外，在显卡运行各种不同负载的时候，或者运行同一个负载但不同阶段的时候，显卡的占用率等指标是不一样的，从而时钟频率会在一个范围内动态调整，而且这个范围的分布也是有规律的，在分布内，一些接近中部的频率出现的概率会高一些。

　　考虑到这种分布的情况，在制定独立显卡参数配置的时候，先标定一个有代表性的负载，然后在这个负载运行的时候，全程测量并统计时钟频率的分布，最终在整个负载完成后，把平均时钟频率作为参数配置中的定义。当然，对于不同的平台，有着不同的TDP，即基于散热的设计功耗。更宽松的TDP限制下，时钟频率的分布范围也会整体提升。

　　英特尔锐炫 A 系列移动端独立显卡

　　产品方面，英特尔锐炫 A 系列移动端独立显卡首发两款型号，包括针对超薄本设计的 A350M 以及为兼顾性能和轻薄而设计的 A370M，搭载锐炫5和锐炫7系列的产品，会在今年夏天面市。

　　A370M有8个Xe内核和光追单元，64bit位宽，时钟频率1550，4GB显存，功耗设计在35瓦到50瓦。A550M的Xe内核数和显存位宽等参数上，基本是A370M的两倍。锐炫7系列有A730M和A770M两款产品，最高可达32Xe内核，16GB内存，256bit位宽。

　　英特尔锐炫 A 系列独立显卡均全面支持 DirectX 12 Ultimate 和领先的游戏技术，例如硬件加速的光线追踪和 Xe 超级采样（XeSS），XeSS 将在今夏发布，并有望得到超过 20 款游戏的支持。为了让业内更多软件和硬件支持该技术，英特尔计划面向所有人开放 XeSS SDK 和工具包。

　　性能测试

　　首先是与集显对比，相对于第12代酷睿移动处理器搭载的集显，最多可达两倍的性能提升。同时这些游戏都能在1080p 60fps运行，能给用户不错的体验。

　　对比12代酷睿i7-1280P中集成的96个执行单元、1450MHz频率的锐炬Xe核显，综合游戏性能高出一倍左右。

　　在运行包括《GTA V》、《堡垒之夜》等游戏时，A370M显卡能在1080p下达到90帧每秒，而且这是在开了中等或者高画质下测量的结果。

　　内容创作方面，相比第12代酷睿的集成显卡，搭载A370M独立显卡的平台在视频编解码方面，以Davinci为例，4K H.264转H.265的性能可多达60%的提升。而在AI相关功能上，例如Adobe PR里的两个应用场景，更是有翻倍的性能提升。

　　值得注意的是，性能的提升并不仅仅来自于独立显卡，同样得益于基于整个系统的Deep Link技术的加持。Deep Link涵盖了不同的技术，例如：动态功率共享，超级编码和超级算力。

　　首先是动态功率共享，该技术能在系统功耗的限制范围内，尽可能最大化释放CPU或GPU的性能。所有搭载英特尔12代酷睿和锐炫的笔记本电脑，都能启用这项技术。

　　第二个是超级编码技术。在之前的编解码流程里，通常把编码工作放在一个显卡的编解码器上，编码效率成为了整个流程的性能瓶颈；而现在的笔记本系统，例如搭载了12代酷睿处理器和锐炫A系列独立显卡的系统，集成显卡和独立显卡都有硬件编码能力。所以超级编码技术，就是同时运用两个显卡的编解码引擎，来大大提升编解码效率。这种协作是通过OneVPL（一个跨平台的开放性框架）的API接口来实现的。当超级编码开始工作时，一组组解码后的原始帧通过特定的API函数被交给oneVPL，进而按组被分配到不同的多媒体引擎上，拷贝到相应的内存中缓存起来。不论每一组有多少帧，相应的集显或者独显的多媒体引擎会开始按照设定的格式编码。而OneVPL会完成后续的打包工作，把编码后的帧一组组拼接成最终视频来输出。这种并行处理，编码效率比单一显卡提升非常显著。

　　三是超级算力。我们知道，每一个搭载英特尔锐炫独立显卡的笔记本，都可以从独立显卡的算力中获益，但是不要忘记，英特尔CPU的集成显卡中同样也提供了计算引擎。为了把负载合理的分配给不同的计算引擎，就设计一个基于机器学习的服务——MLS。

　　MLS是OpenVino中的一个框架，它能智能的把负载分配给不同的算力模块。根据当前应用或负载的特征，例如延迟敏感度，吞吐量，性能要求，功率消耗等等。这些因素帮助MLS做出决策，把负载分配给独立显卡，集成显卡，或者CPU。

　　举个例子，当你想对一段视频做处理，例如去噪点，超分，锐化等等，导入画面会逐帧传递给MLS框架，每一帧还会拆成若干块，这些块排在工作队列里，MLS启动一个个工作线程，把这些块根据需求自动分配到不同的算力模块中。如图所示，一部分分配到集显的计算引擎，一部分分配到独显的矩阵引擎。随着显卡完成当前任务，MLS会不断派发新的任务。直到最后完成所有块的处理，打包这些增强后的画面作为输出。

　　正是因为全新Deep Link技术的加持，在内容创作上，动态功率共享、超级编码、超级算力可以分别带来最多30％、60％、24％的性能提升。

　　Xe 媒体引擎：提供最广泛的编/解码器首发支持AV1

　　媒体引擎方面，提供了对H.265 / HEVC、H.264 / MPEG-4 / AVC、VP9 的支持，以及业界首个对 AV1编码和解码的硬件加速支持。

　　开放媒体联盟主席Matt Frost先生指出，AV1的效率比最常见的编解码器H.264高了50%，比HEVC高了20%，能够以更低的带宽和更小的文件大小提供更高的画面质量，而且它是开放的且没有版权费。目前，FFMPEG、Handbrake、Adobe 和 XSplit 都已经集成了对锐炫 AV1的支持。

　　Xe 显示引擎：加入全新Smooth Sync（平滑同步）

　　在显示方面，Xe已经支持HDMI 2.0b 和 DP1.4a的规格，游戏玩家可以享受高达1080p@360Hz、或者4 台具有 4k@120Hz HDR的显示器连接。

　　在同步技术方面，英特尔支持VESA 标准的Adaptive Sync，可提供流畅的游戏而不会撕裂。此外还有Speed Sync 可以适用于任何显示器并解决不同的问题。

　　此次全新推出的Smooth Sync技术，运用了模糊化两个撕裂帧之间的边界，来减少视觉失真，使图像看起来更加连贯。之后所有锐炫显卡都会支持Smooth Sync功能。

　　产品上市与相关生态

　　无疑问，得益于Evo平台更快的处理器速度、超长的续航时间、轻薄便携时尚的外观设计，很多OEM都将优先推出锐炫配置在Evo设计上，在英特尔锐炫显卡的加持下，将让游戏和内容创作在Evo平台上有更好的使用体验。据英特尔介绍，从第二季度开始，采用锐炫 3系列的笔记本产品有望国内面市，锐炫 5和锐炫 7系列的产品有望在今年夏天发布。

　　在此次英特尔锐炫 A 系列独立显卡的解析会上，英特尔还发布了新的显卡控制界面——Arc Control英特尔锐炫控制面板。

　　Arc Control提供了一站式与锐炫显卡相关的设定或者信息接收，包括可以让用户快速升级驱动，及时看到显卡性能的工作负载、虚拟摄像头设定、自动生成游戏高光时刻、还有让每个人都能成为像是专业主播一样的软件设定等。

　　目前，Arc Control控制面板已经可以下载。需要注意的是，Arc Control 控制面板适用于所有英特尔显卡，也因此不仅仅只有英特尔的独立显卡能用，英特尔的集成显卡也能用。再者，值得一提的是，Arc Control 控制面板不需要登录，这一功能大大提升了用户体验。

　　英特尔锐炫 A 系列移动端独立显卡的推出，首先是进一步完善了英特尔移动平台。此外，也为用户和游戏玩家带来更多一项选择。随着相关产品的上市，相信可以缓解目前“一卡难求”的市场局面。对于另外两家显卡厂商，到底是挑战，还是在竞争中创新、进步，那就敬请期待吧。

关注我们