英特尔发布迄今为止最复杂SoC
北京时间8月19日晚间,在线上举行的2021年英特尔架构日活动上,英特尔公司高级副总裁兼加速计算系统和图形事业部总经理Raja Koduri携手多位英特尔架构师,发布了该公司近年来在架构方面取得的一系列创新成果。其中,Ponte Vecchio是英特尔迄今为止最复杂的SoC(片上系统)。其包含了1000亿个晶体管,将会交付给美国阿尔贡国家实验室“极光”(Aurora)超级计算机,以及其他潜在的高性能计算机客户。Raja Koduri称,其在一个流行的人工智能(AI)基准测试上已经创造了推理和训练吞吐量的行业纪录。
8月20日,英特尔中国研究院院长宋继强在与媒体线上沟通时表示,此次发布的成果主要围绕三条主线,展示了英特尔近十年来架构方面的“升级改造”。首先在中央处理器(CPU)架构方面,英特尔推出了“能效核”和“性能核”。能效核旨在面对多任务场景,提高吞吐量效率并提供可扩展多线程性能,以能耗比作为优化的目标。 性能核则致力于提高速度,突破低时延和单线程应用程序性能的限制。这两者各有侧重。
为使性能核和能效核与操作系统无缝协作,英特尔还开发了一种改进的调度技术,称之为“英特尔硬件线程调度器”。硬件线程调度器直接内置于硬件中,可提供对内核状态和线程指令混合比的低级遥测,让操作系统能够在恰当的时间将合适的线程放置在合适的内核上。“其具有动态性和自适应性,会根据实时的计算需求调整调度决策,而非一种简单的、基于规则的静态方法。”宋继强说。
其次,在客户端方面,英特尔推出了代号为Alder Lake的客户端SoC及Xe HPG微架构和Alchemist SoC。其中,Alder Lake是英特尔首款性能混合架构,首次集成了两种内核类型——性能核和能效核,以带来跨越各种工作负载类型的性能提升。其基于Intel 7制程工艺,支持最新内存和最快I/O,可以应用于从超便携式笔记本到发烧级、商用台式机的多类型客户端设备。
Xe HPG则是独立显卡微架构,采用Xe内核,是一款聚焦计算、可编程且可扩展的元件,专为游戏和创作工作负载提供发烧级的高性能。以Xe HPG微架构为动力的Alchemist系列SoC首批相关产品将于2022年第一季度上市,并采用新的品牌名——英特尔锐炫。
最后,在服务器端架构方面,英特尔发布了Sapphire Rapids下一代英特尔至强可扩展处理器和基础设施处理器(IPU)。Sapphire Rapids处理器可在不断变化且要求日益增高的数据中心使用中提供较高的计算性能,并对工作负载进行优化,以在云、微服务和AI等弹性计算模型上提供高性能计算。IPU是一种可编程的网络设备,旨在使云和通信服务提供商减少在CPU方面的开销,并充分释放潜在性能。
Ponte Vecchio则是基于Xe HPC微架构,提供业界领先的每秒浮点运算次数(FLOPs)和计算密度,以加速AI、HPC和高级分析工作负载。据介绍,Ponte Vecchio由多个复杂的设计组成,这些设计以单元形式呈现,然后通过嵌入式多芯片互连桥接(EMIB)单元进行组装,实现单元之间的低功耗、高速连接。这些设计均被集成于Foveros封装中,为提高功率和互连密度形成有源芯片的3D堆叠。高速MDFI互连允许1到2个堆栈的扩展。“Ponte Vecchio是英特尔迄今为止最复杂的SoC,也是异构集成的绝佳典范。”宋继强说。
在架构日上,Raja Koduri强调了架构提升的重要性:“架构是硬件和软件的‘炼金术’。它将特定计算引擎所需的先进的晶体管结合在一起,通过领先的封装技术将它们连接,集成高带宽和低功耗缓存,并在封装中为混合计算集群配备高容量、高带宽内存和低时延、可扩展互连,同时确保所有软件无缝加速。随着桌面到数据中心的工作负载变得前所未有的密集、复杂、且多样,今年公布的这些新突破也展示了架构将如何满足对于更高计算性能的迫切需求。”
在他看来,这些新架构将为即将推出的高性能产品注入动力,并为英特尔的下一个创新时代奠定基础,以满足世界对高计算能力日益增长的需求。