Page 31 - 网络电信2023年11月刊
P. 31
光 通 信
基于CNN-BiLSTM-Attention模型的光纤
非线性损伤补偿算法
1
1
1
1
1
1
陈志轩 ,张洪波 ,张敏 ,蔡炬 ,刘娇 ,杜杰 ,张倩武 2
1.成都信息工程大学 通信工程学院
2.上海大学特种光纤与光接入网省部共建重点实验室
摘 要:克尔效应和色散对相干光纤通信系统的传输距离和数据容量有极大
限制。为了补偿光纤传输中的非线性损伤,结合卷积神经网络(convolutional
neural network,CNN)、双向长短期记忆网络(bi-directional long short-term
memory,BiLSTM)和注意力机制(attention)的特点,提出了一种基于CNN-BiLSTM-
Attention模型的光纤非线性损伤补偿算法,并在DP-16QAM 30Gbaud的相干光
通信系统中进行了仿真。仿真结果表明,与CNN-BiLSTM模型相比,在1200 km
的传输距离下,该算法以降低0.03~0.23 dB的Q因子为代价,使复杂度降低了约
31.6%;在相似复杂度下,该算法在最佳传输功率下的Q因子提高了0.43 dB。
关键词:光纤非线性损伤补偿;卷积神经网络;双向长短期记忆网络;注意力机制;
计算复杂度由模型中每个符号所需的实际乘法数量(real
引言 multiplications per symbol,RMp S)来表示,RMp S的大小
随着下一代移动通信系统和云计算基础设施的持续部署, 与输入序列长度、滤波器数量、核大小以及隐藏单元的数量有
对光通信链路带宽容量的需求也持续增加。相干光通信是实 关。目前已有一些降低计算复杂度的方法,如文献[16]提出了
现大容量光传输的重要方式 [1,2,3] ,但是,相干光传输系统中 一种面向中心的LSTM算法,通过改变LSTM模型结构降低算法的
光纤的非线性损伤限制了它的进一步发展 [4,5,6] 。为解决这一
计算复杂度。但是,该方法是将一个完整的序列输入到一个新
问题,学者们提出了一些基于数字信号处理(digital signal 的单元结构中,没有考虑输入序列长度对模型的影响,有碍于
processing,DSP)技术的非线性损伤补偿算法,如数字反向传播
进一步降低计算复杂度。基于此,本文提出将CNN-Bi LSTM与注
(digital backpropagation,DBP)和基于Volterra的非线性均衡 意力机制相结合,利用注意力机制研究输入序列中每个输入符
器等 [7,8,9,10] 。这些算法的计算复杂度较高,增加了DSP的功耗和 号对于接收符号的权重分布,通过权重分布对模型的输入序列
处理延迟时间 [11] 。 进行修剪以降低计算复杂度。
机器学习由于具有能学习数据潜在特征和联系的特点,
并且无需事先获得链路知识,近年来逐渐被应用到光通信领域
[12] 。其中一些基于神经网络的方法已被用于光纤非线性损伤 一、基本原理
补偿 [13,14,15] ,如文献 [13] 将长短期记忆网络(long short-term 1.1 Bi LSTM
LSTM通常用于动态输入序列,并且可以缓解神经网络中的
memory,LSTM)与传统DSP相结合,用于光纤非线性均衡。LSTM可
梯度消失问题。LSTM结构如图1所示。在t时刻,LSTM的主要结
以将输入符号的后续符号一起视为输入信息,因此其可以捕获 构由输入门i t 、遗忘门f t 、输出门o t 和细胞状态c t 组成。输入门
时间动态行为和过程顺序信息。文献 [14] 将双向长短期记忆网络
决定了c t 中哪些当前的信息需要被储存,遗忘门决定了c t-1 中哪
(bi-directional long short-term memory,Bi LSTM)用于光纤 些过去的信息需要被遗忘,输出门决定了c t 中哪些信息需要传
非线性均衡,扩展了传统的单向LSTM,用于模拟当前状态对过
递到下一个单元。LSTM内部的计算公式如下:
去和未来状态的依赖,具有比LSTM更高效的非线性处理能力。
文献 [15] 对几种基于神经网络的非线性损伤补偿算法进行了比
较,在复杂度较高的情况下,CNN-Bi LSTM比Bi LSTM的性能更
(1)
好,并且达到最佳性能所需的周期数也更少。但是CNN-Bi LSTM
内部单元中存在大量的乘法运算,会产生计算复杂度过高的问
题。
52 网络电信 二零二三年十二月