

下载链接:Intel 2021架构大会汇总
https://www.intel.com/content/www/us/en/newsroom/resources/press-kit-architecture-day-2021.html
大会演讲材料:
https://download.intel.com/newsroom/2021/client-computing/intel-architecture-day-2021-presentation.pdf
https://download.intel.com/newsroom/2021/client-computing/intel-architecture-day-2021-event.zip
两种全新x86内核架构的详情
英特尔首个性能混合架构,代号“Alder Lake”,
智能的英特尔®硬件线程调度器;
专为数据中心设计的下一代英特尔®至强®可扩展处理器Sapphire Rapids;
基础设施处理器(IPU);
即将推出的显卡架构,包括Xe HPG微架构和Xe HPC微架构,以及Alchemist SoC, Ponte Vecchio SoC。

两款全新x86内核 AI加速提升约8倍!

拥有5000个条目的分支目标缓存区,实现更准确的分支预测
64KB指令缓存,在不耗费内存子系统功率的情况下保存可用指令
英特尔的首款按需指令长度解码器,可生成预解码信息
英特尔的簇乱序执行解码器,可在保持能效的同时,每周期解码多达6条指令
后端宽度(Wide Back End)具备5组宽度分配(Five-wide allocation)和8组宽度引退、256个乱序窗口入口和17个执行端口
支持英特尔®控制流强制技术和英特尔®虚拟化技术重定向保护等功能
实现了AVX指令集以及支持整数人工智能操作的新扩展

更宽:解码器由4个增至6个,6µop缓存增至8µop,分配由5路增至6路,执行端口由10个增至12个 更深:更大的物理寄存器文件(physical register files),拥有512条目的重排序缓冲区 更智能:提高了分支预测准确度,降低了有效的一级时延,优化了二级的全写入预测带宽
相比目前的第11代英特尔®酷睿™处理器架构(Cypress Cove),在通用性能的ISO频率下,针对大范围的工作负载实现了平均约19%的改进 呈现出更高的并行性和执行并行性的增加 搭载英特尔®高级矩形扩展(AMX),内置下一代AI加速提升技术,用于学习推理和训练。AMX包括专用硬件和新指令集架构,以明显提高矩阵乘法运算 减少时延,对大型数据和代码体积较大的应用程序提供更好的支持


高性能、双芯片、插座式的台式机处理器 ,具有领先性能和能效。支持高规格的内存和I/O 高性能笔记本处理器,采用BGA封装,并加入图像单元,更大的Xe显卡和Thunderbolt 4连接 轻薄、低功耗的笔记本处理器,采用高密度的封装,配置优化的I/O和电能传输。
具有高动态频率范围,并且能够动态选择数据路径,根据实际总线结构负载而进行时延和带宽优化。
根据利用率动态调整最后一级缓存策略——也就是“包含”或“不包含”。
I/O内部总线支持可高达64GBps,连接不同类型的I/O和内部设备,能在不干扰设备正常运行的情况下无缝改变速度,选择内部总线速度来匹配所需的数据传输量。
内存结构可提供高达204GBps的数据,并动态扩展其总线宽度和速度,以支持高带宽、低时延或低功耗的多个操作点。
智能的英特尔®硬件线程调度器

使用硬件遥测工具将需要更高性能的线程引导到当时适合的性能核上
更精细地监控指令组合、每内核当前状态以及相关的微架构遥测,从而帮助操作系统做出更智能的调度决策
通过与微软合作,优化英特尔硬件线程调度器在Windows11上的极佳性能
扩展PowerThrottling API,使得开发人员能够为其线程明确指定服务质量属性
应用全新EcoQoS分类,该分类可让调度程序获悉线程是否更倾向于能效(此类线程会被调度到能效核)
下一代英特尔®至强®可扩展处理器Sapphire Rapids
专为数据中心设计

基础设施处理器(IPU)

基础设施功能和客户工作负载的强分离使客户能够完全控制CPU
云运营商可以将基础设施任务卸载到IPU上,更大化实现CPU利用率和收益
IPU可以管理存储流量,减少时延,同时通过无磁盘服务器架构有效利用存储容量。借助IPU,客户可以通过一个安全、可编程、稳定的解决方案更好地利用资源,使其能够平衡处理与存储
超大规模就绪,提供高性能网络和存储虚拟化卸载,同时保持高度控制
提供业界一流的可编程数据包处理引擎,支持防火墙和虚拟路由等用例
使用硬件加速的NVMe存储接口,该接口扩展自英特尔傲腾技术,以模拟NVMe设备
采用英特尔®高性能Quick Assist技术,部署高级加密和压缩加速
可使用现有普遍部署的DPDK、SPDK等软件环境进行编程,并且可以采用英特尔Barefoot Switch部门开创的P4编程语言来配置管线
Oak Springs Canyon是一个IPU参考平台,基于英特尔®至强D处理器(Intel®Xeon-D)和拥有业界领先的功率、效率、性能的英特尔®Agilex™ FPGA构建:
卸载Open Virtual Switch(OVS)等网络虚拟化功能以及NVMe over Fabric和 RoCE v2等存储功能,并提供硬化的加密模块,提供更安全、高速的2x 100Gb以太网网络接口
让英特尔的合作伙伴和客户能够使用英特尔®开放式FPGA开发堆栈(英特尔®OFS)定制其解决方案,这是一款可扩展、开源软件和硬件基础设施
使用现有普遍部署的软件环境进行编程,包括已在x86上优化的DPDK和SPDK
英特尔N6000加速开发平台,代号为“Arrow Creek”,是专为搭载至强服务器设计的SmartNIC。其特性包括:
在功耗、效率和性能方面处于行业领先地位的英特尔Agilex FPGA。用于高性能的100GB网络加速的英特尔以太网800系列控制器
支持多种基础设施工作负载,使通信服务提供商(CoSP)能够提供灵活的加速工作负载,如Juniper Contrail、OVS和SRv6,它以英特尔PAC-N3000的成功为基础,该产品已在部分业界一流的CoSP中部署。
集成1000亿个晶体管!
迄今最复杂的SoC Ponte Vecchio

一块单元有8个Xe内核,总共有4MB一级缓存,是提供高效计算的关键
基于台积电先进的N5制程工艺技术
英特尔已通过设计基础设施设置和工具流程以及方法,为测试和验证该节点的单元铺平了道路
该单元具有极其紧凑的36微米凸点间距,可与Foveros进行3D堆叠
基础单元是Ponte Vecchio的连接组织。它是基于Intel 7制程工艺的大型芯片,针对Foveros技术进行了优化。
基础单元是所有复杂的I/O和高带宽组件与 SoC 基础设施——PCIe Gen5、HBM2e 内存、连接不同单元MDFI链路和EMIB桥接
采用高2D互连的超高带宽3D连接时延很低,使其成为一台无限连接的机器
英特尔技术开发团队致力于满足带宽、凸点间距和信号完整性方面的要求
Xe链路单元提供了GPU之间的连接,支持每单元8个链路。
对HPC和AI计算的扩展至关重要
旨在实现支持高达90G的更高速SerDes
该单元已被添加到“极光”(Aurora)百亿亿次级超级计算机的扩展解决方案中
Ponte Vecchio已走下生产线进行上电验证,并已开始向客户提供限量样品。Ponte Vecchio预计将于2022年面向HPC和AI市场发布。
Xe HPG微架构和Alchemist SoC
全新的独立显卡微架构

多达8个具有固定功能的渲染切片,专为DirectX 12 Ultimate设计
全新Xe内核,拥有16个矢量引擎和16个矩阵引擎(被称为XMX,即Xe Matrix eXtension)、高速缓存和共享内部显存
支持DirectX Raytracing(DXR)和Vulkan Ray Tracing的新光线追踪单元
通过架构、逻辑设计、电路设计、制程工艺技术和软件优化,相比Xe LP微架构实现1.5倍的频率提升和1.5倍的每瓦性能提升
使用台积电的N6制程节点上进行制造
英特尔显卡设计的核心是软件优先,我们正与开发人员密切合作进行Xe微架构的设计,力求与行业标准保持一致
通过在一个统一的代码库中涵盖集成和独立显卡产品的驱动设计,英特尔的第一款高性能游戏显卡将性能和质量放在首位
英特尔已完成了内核显卡驱动程序组件的重新架构,特别是内存管理器和编译器,从而使计算密集型游戏的吞吐量提高了15% (至多80%),游戏加载时间缩短了25%
XeSS
XeSS的工作原理是通过从相邻像素,以及对前一帧进行运动补偿,来重建子像素细节
重构由经过训练的神经网络执行,可提供高性能和高画质,同时性能提升高达两倍
XeSS凭借DP4a指令,在包括集成显卡在内的各种硬件上提供基于AI的超级采样
多家早期的游戏开发商已开始使用XeSS, 本月将向独立软件供应商(ISV)提供XMX初始版本的SDK,DP4a版本将于今年晚些时候推出
结语
下载链接:Intel 2021架构大会汇总
https://www.intel.com/content/www/us/en/newsroom/resources/press-kit-architecture-day-2021.html
本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。

免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。
电子书<服务器基础知识全解(终极版)>更新完毕,知识点深度讲解,提供182页完整版下载。
获取方式:点击“阅读原文”即可查看PPT可编辑版本和PDF阅读版本详情。
温馨提示:
请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。






