替代SLIMLINE的下一代高速互联方案Gen-Z接口并入CXL

替代SLIMLINE的下一代高速互联方案Gen-Z接口并入CXL英特尔即将推出的用于服务器的处理器系列 Sapphire Rapids 是第一代能够处理 CXL 它在第一次迭代中基于 PCI Express 5 0 但希望快速切换到 PCIe 6 0 以获得更高的传输速率

大家好,欢迎来到IT知识分享网。

替代SLIMLINE的下一代高速互联方案Gen-Z接口并入CXL

Gen-Z的由来

Gen-Z 其实是一堆行业巨头不满意 Intel 技术垄断和演进的情况下,合作搞出的新型高速互连标准,AMD、ARM、博通、Cray、戴尔 EMC、HPE、华为、IBM、联想、Mellanox (NVIDIA)、美光、红帽、三星、希捷、SK 海力士、西数、赛灵思等等都在其中,CPU,模组,网络,服务器,存储,连接器,操作系统,硬盘,FPGA的龙头老大都已经齐聚一堂,好像也看到无处不在的大陆连接器线缆龙头大哥,立迅精密.

替代SLIMLINE的下一代高速互联方案Gen-Z接口并入CXL

替代SLIMLINE的下一代高速互联方案Gen-Z接口并入CXL

CXL的由来

互连技术一直是数据中心的关键和核心技术。近年来,随着云计算模式成为主流、大数据飞速积累引起重视、人工智能与深度学习的数据处理方式受到青睐等技术与产业趋势的发展,数据中心内部的架构组织、关键技术等开始呈现出变化,对互连技术形成了挑战和影响;互连技术也呈现出芯片内解耦、芯片间新互连协议纷纷涌现、系统间RDMA技术优势明显、物理层统一融合加速、光和电集成需求更加迫切等技术和应用发展趋势、Intel去年联合众厂商一起推出了针对数据中心,高性能计算,AI等领域的全新的开放性的互联协议,与Gen-Z,CCIX等发展多年的规范进行竞争,从最近CXL联盟公布的最新成员信息来看,CXL规范已经获得了业界主要芯片公司、云计算厂家、传统大型IT企业的支持(阿里巴巴、戴尔、EMC、脸谱、谷歌、HPE、华为、微软、AMD和ARM也都先后加入了进来),Intel在去年成立CXL联盟的时候就发布了1.0版规范,并且随后又发布了改进后的1.1版规范,而现在,它们宣布发布CXL 2.0规范

替代SLIMLINE的下一代高速互联方案Gen-Z接口并入CXL

Gen-Z 终“认输”,并入CXL

从某种角度看,再现上世纪80年代末和90年代初的总线大战会很有趣。供应商之间为争夺他们所控制的标准而进行的斗争最终导致了PCI-X和PCI-Express总线的创建,这些总线以及分支InfiniBand interconnect在服务器领域占据了20年的主导地位,以及分支InfiniBand interconnect,它最初是作为一个通用的交换结构来连接高带宽和低延迟的所有东西。这可能要比其他情况下花费更长的时间——改写历史是很困难的。

但我们可以告诉你的是,我们在过去几个月里讨论过,那些经历过总线战争的勇士们已经从他们创造的历史中吸取了教训,他们不愿意在运输和协议方面进行旷日持久的战斗,这些协议为混合计算引擎提供了内存一致性。原因是我们没有时间听这些废话,而且随着全球经济很可能陷入衰退,我们更没有时间听这些鬼话和自我膨胀。

这就是为什么我们在同一周于去年9月在圣何塞举办了下一次I/O平台活动,这是一个愉快的巧合,而不是计划,所有关键一致性工作的成员——英特尔的Compute Express Link(CXL)、IBM的Concordent Accelerator Interface(CAPI)和OpenCAPI superset,Xilinx的Accelerators缓存一致性互连(CCIX)和AMD的Infinity Fabric、Nvidia的NVLink互连和Hewlett-Packard Enterprise的Gen-Z互连,以及戴尔早期大力支持的,所有这些都支持Intel的CXL协议互连,它本身就是PCI Express 5.0的超集,用于连接处理器和加速器并共享它们的内存。我们同时在这里做了一个非常深入的研究,这又是一个巧合。称之为调和收敛。

CXL和它的连贯内存互连被设计成将处理器与它们的加速器和系统内的内存类存储连接起来,Gen-Z最初被设计成一个内存结构,可以有许多不同的计算引擎挂在它上面,共享各种各样的内存。没有规定说CXL不能扩展到服务器的金属外壳之外,以在一个、两个或三个机架上的多个服务器节点上提供一致的内存访问(例如,就像GigaIO正在进行的PCI-Express交换互连一样)。同样,也没有规定Gen-Z不能用作服务器节点中的协议。嗯,根据经济学原理,CXL可能比Gen-Z更便宜,这主要是由于硅光子学涉及到长距离的相干性。(我们还深入研究了HPE在2019年9月编写的Gen-Z交换芯片,并且还审查了Gen-Z联盟正在原型化以创建池主内存的Gen-Z内存服务器。)

不过,根据Gen-Z联盟主席、戴尔服务器架构和技术主管Kurtis Bowman与CXL联盟主席、英特尔技术项目主管Jim Pappas签署的一份谅解备忘录,这两个可能交战的阵营已经埋下了仇恨。他们已经决定完全不使用任何hatchets,并努力使CXL和Gen-Z能够在适当的地方互操作和互连。具体来说,他们已经成立了一个联合工作组来解决这些分歧,努力使这些技术保持一致。(仔细想想,这似乎是合理的。)

Bowman和Pappas在过去的几个月里都和我们讨论过使用CXL作为服务器内部Gen-Z织物的潜在安装点,我们怀疑这就是他们如何分割Gen-Z硅的方法,直到Gen-Z硅大量生产出来。HPE Gen-Z芯片组的高带宽硅光子学将是Cadillac版本的连接服务器到内存(要么是原始的、聚合的内存,要么是加速器或协处理器内部的内存),而CXL端口将是Chevy版本,具有更短的距离和更低的带宽。

Pappas解释说:“两种方案的DNA中都有记忆。“使用CXL,你触及的范围有限,因为它基本上是PCI-Express。但有了Gen-Z,您就有了更大的距离——机架、行甚至数据中心。但归根结底,你有一个连贯的CPU接口,即CXL,然后Gen-Z让你把所有的接口都带到更远的地方,让它工作。”

目前还没有尝试合并传输或协议的说法,但从长远来看,如果CXL最终成为运行在各种硅光子学传输(包括但不限于Gen-Z)上的协议,我们不会感到惊讶。在某种程度上,PCI Express将不是系统总线,因此CXL不能无限期地绑定到该总线。但是,这是很多很多年以后的事了。

在CXL和Gen-Z的工作方式上存在一些差异,需要协调,以便它们能够正确地相互交谈。

Bowman解释说:“CXL是一个真正的硬件一致性设计,应用软件根本不需要意识到这一点。”“Gen-Z没有内置的硬件一致性,因此它正在寻找一个软件一致性模型,并使用原子等技术来实现这一点。如果您的应用程序想要跨越一个大的内存空间并共享特定的区域,则必须编写软件才能利用这一点。我们无法在硬件中实现Gen-Z一致性的原因是,连接到内存的机器之间的snoop循环将消耗大部分结构带宽。你可以两全其美。如果您需要硬件一致性互连,CXL是一种方法,如果您需要一种结构来共享机架内或跨行的资源,那么Gen-Z是一种方法。但这种一致性将在软件中实现。”

我们面临的问题是,谁将成为CXL和Gen-Z的开路先锋。当然,答案之一是微软及其庞大的Azure公共云。微软公司Azure云的杰出工程师Leendert van Doorn是CXL和Gen-Z联合体的董事会成员,他分享了一些他对这将如何工作的想法。“我把CXL看作是一个本地的节点互连,”van Doorn说。“一旦你开始考虑分解(disaggregation)——特别是在机架级别上——你就需要去做别的事情,因为PCI Express 5.0没有扩展到那么远。是的,您可以构建重定时器,而且有些人过去曾经构建过基于PCI Express的结构,但他们遇到了一些挑战。这些都是Gen-Z已经解决和解决的挑战,我们现在讨论的实际上是CXL和Gen-Z之间的接口。现在,我们是否会看到在一个具有CXL的节点内以较小的规模进行分解?是的,当然。我们期待看到。但是,当您可以将其扩展到机架上或希望跨整个机器行进行扩展时,真正的分解收益就会发挥作用。那就是您需要研究另一种结构(fabric)技术的时候了。”

那么,微软如何在其基础设施中利用CXL和Gen-Z呢?van Doorn给出了一些提示,这些提示与我们一直以来的想法是一致的。例如,我们有基于机架的flash模块在NVM-Express上共享数据到一个服务器机架,我们可以有基于机架的主内存(持久的或动态的,我们不关心)在Gen-Z上共享数据。

“我的服务器大约50%的成本是内存,”van Doorn说。因此,如果我能更有效地使用这些内存,并在系统之间共享它们,就会有巨大的好处。所以你可以想象系统在节点上有一定量的内存,然后在服务器之间共享另一块内存,根据需要从池中取出。”

一切都会归结为延迟。van Doorn说,DRAM内存访问在节点内部大约80纳秒,而通过快速NUMA互连,对远程存储器的典型访问大约为135纳秒。虽然操作系统内核可以在一定程度上屏蔽这种影响,但它们是显而易见的。这就是为什么机架外的主内存池(即使使用Gen-Z)将更具挑战性,因为它们将增加额外的延迟-根据范围的不同,从数百纳秒到毫秒不等。但是,对于其他持久性介质(其固有速度比主存储器慢),由于该介质增加了设备延迟,使用Gen-Z这样的协议跨越许多机架、行甚至更远,因为Gen-Z结构互连将比设备快得多。而且Gen-Z的延迟比以太网或InfiniBand要低得多,从长远来看,这应该是row和数据中心级存储互连的首选结构。不管怎样,这就是理论。

最后,延迟和可替换性的相互作用将发挥出来,我们认为,一旦这些协议得到强化,设备出现,人们将试图在服务器节点中放置尽可能少的内存和存储,以摆脱并创建可组合池来扩展它。这将是最好的经济和技术意义。

另一个问题是,CXL和Gen-Z何时会成为数据中心基础设施的常规部分?Gen-Z开发工具现在已经可供联盟成员使用,Bowman说早期的采用者将在2022年上线,到2023年到2024年将成为主流。根据Pappas的说法,对于CXL,硅即将投入使用,它将在2020年进行调试,通常在那之后的一年才会投入系统。

替代SLIMLINE的下一代高速互联方案Gen-Z接口并入CXL

据报道,Gen-Z 互连背后的推动者正在认输。资料显示,制造商 AMD、架构设计公司ARM、两家服务器供应商戴尔和 HPE、内存制造商美光和 FPGA 专家赛灵思自 2016 年以来一直在开发 Gen-Z,以便通过协议处理器、PCI- Express 内存和加速器进行通信。

然而,Gen-Z 联盟缺少两个重要的名字:英特尔和英伟达。虽然英伟达最终在 2020 年 8 月加入该联盟。但英特尔推出了相互竞争的互连 Compute Express Link (CXL),改联盟的支持者有阿里巴巴、思科、戴尔 EMC、Facebook、谷歌、HPE、华为和微软。

当 AMD、ARM、IBM、Nvidia 和 Xilinx 于 2019 年夏末加入Gen-Z联盟时,我们能明显察觉到它们将面临困难时期。两个财团随后相互合作——但自 2020 年 5 月以来没有发布任何新闻稿,Gen-Z也沉默了。现在,Gen-Z 想要完全停止自己的开发,将这个领域决定留给 CXL。

从CXL支持者提供的消息可以看到,GenZ的做法是希望将所有规格和资产转移到CXL联盟,但这仍需要各方的同意。值得一提的是,行业内仍有 CCIX 和 OpenCAPI与之竞争,但行业正在朝着 CXL 方向发展。

AMD 的 Infinity Fabric 专门用于将其自己的 Eypc 处理器与 Instinct 加速器耦合,就像 Nvidia 的 NV-Link 与 IBM 的 Power CPU 及其自己的 GPU 加速器(如 A100)一样。

英特尔即将推出的用于服务器的处理器系列 Sapphire Rapids 是第一代能够处理 CXL,它在第一次迭代中基于 PCI Express 5.0,但希望快速切换到 PCIe 6.0 以获得更高的传输速率。AMD 紧随其后的是 CPU 系列 Epyc 7004,别名 Genoa。三星已经宣布 CXL 内存扩展器为 PCIe DRAM。

替代SLIMLINE的下一代高速互联方案Gen-Z接口并入CXL

替代SLIMLINE的下一代高速互联方案Gen-Z接口并入CXL

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/91654.html

(0)

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

关注微信