Page 35 - 网络电信2024年10月刊
P. 35
确定性光传输支撑广域长距算力互联
王光全1,满祥锟1,徐博华1,吕福华2,孟万红2
1.中国联通研究院 2.华为技术有限公司
摘要:高性能算力产业的需求随着人工智能应用的普及和不断发展而持续增加,出现了越来越多
的算力协同场景。介绍了算力互联、数据传输中,影响RDMA长距吞吐量的因素,提出了超大带宽及确
定性体验的网络解决方案,以实现高性能算力互联。
关键词:长距RDMA;全光网;OTN;OXC
引言 1、RDMA现状及应用于广域算力互联的挑战
2022年1月,国务院印发《“十四五”数字经济发展规 1.1 RDMA技术介绍
划》,提出加快建设信息网络基础设施,有序推进基础设施智 传统的TCP/IP存在着网络传输和数据处理延迟过大、多次
能升级,加快实施“东数西算”工程的要求。随着国家东数西 数据拷贝和中断处理、复杂的TCP/IP协议处理等问题。RDMA[1-2]
算战略的推进,越来越多的算力协同场景以及跨地域大数据搬 支持本端节点“直接”访问远端节点内存的操作,本端节点可
移场景开始涌现。数据和算力已经不再局限于单一的数据中 以像访问本地内存一样,绕过传统以太网中复杂的TCP/IP网络
心,更多的新型计算任务和大量数据需要在多个算力中心间流 协议栈读写远端内存。由网卡直接进行内存读写操作,能够释
转并进行算力协同,算力中心间的长距高性能传输能力已成为 放CPU算力并降低数据的传输时延,这是一种为了解决网络传输
影响业务性能的关键因素。 中服务器端数据处理延迟问题而产生的技术。
RDMA有3种传输模式:RDMA Send、RDMA Read和RDMA
算力互联意味着将算力中心内部的DCN网络进行延伸,典 Write。如图1所示,其协议传输的主要特征是:以数据块为单
型的DCN网络覆盖范围在10km以内,且高性能计算DCN网络当 元,一次把所要传输数据根据PMTU大小进行切片,直到所有数
前主流的协议为远程内存直接访问(Remote Direct Memory 据块传输完毕;采用PSN系列号机制确认数据的完整性,如果
Access,RDMA),由于RDMA协议要求无损传输,当将DCN网络扩 有丢包,则进行重传;可以配置多队列、多数据块请求、调整
展到广域百公里至千公里的范围时,会导致超长的链路传输时 PMTU大小、设置网卡队列缓存大小等参数,提升RDMA的传输效
延,进而导致网络状态反馈滞后。然而,现有的传输层协议的 率。针对丢包,采用Go Back N重传机制,检测到PSN序列号丢
拥塞控制算法存在不足之处(例如,在长距离传输中,Cubic 失时,则请求从该PSN序列号之后的报文全部重传。目前RDMA
算法的带宽利用率低,丢包现象较为严重),无法有效地利用 协议不支持选择性重传,因此,一旦网络有丢包,则无法保证
带宽。为了应对超长距传输的挑战,满足高性能算力互连的需 RDMA协议的传输效率。
求,承载网必须具备长距无损确定性传输能力,并且需要与终 RDMA技术主要包括IB、RoCE和iWARP。
端侧进行协同,以确保高性能协议的传输效率。因此,如何构 IB(Infini Band):基于Infini Band架构的RDMA技术,需
建大带宽的确定性网络以实现千公里级RDMA的无损传输是当前
广域算力互联领域的研究热点。
网络电信 二零二四年十月 49