Page 40 - 网络电信2019年6月刊下
P. 40
二、主流并行算法概述 Algorithm,ISCA)。该算法将部分乘法单元用加法单元和延迟
1、并行滤波算法 单元替代,同时使用快速卷积来消减子滤波器的数量,同时尽
在实际应用中,如果通信速率不是很高,则并行化算法 量保证子滤波器具有系数对称性。乘法器的数量需要通过依赖
可以通过加法共享来实现。其可以2Gbps到5Gpbs的速度运行, 系数对称性来优化。ISCA算法方程如下:
并且消耗最少的硬件资源。然而,随着通信速度的增加,并行
通道的数量增加,纯粹的加法共享方法在某些情况下由于数据 (1)
维度过高,计算开销过大,容错性低等因素而失去实际应用价 在式(1)的基础上可以进一步推导出多级迭代的公式,适
值。关于并行化处理,快速有限脉冲响应算法(FFA)和迭代短 用于并行级数较高的情况。
卷积算法(ISCA)是用于高速环境的两种并行滤波算法。 多级迭代的公式如下:
FFA算法的本质是一个有限脉冲响应滤波器。它将原始串行
序列经过串并转换后输入到并行输入序列中,然后类似地将滤 (2)
波器系数分解成类似的并行序列。在被分解成并行序列之后, 式中:N=Mk=mnk;
并行化以矩阵形式表示。该算法不需要在基于循环或非周期卷
积方法中使用一般重叠技术。可以显着降低硬件性能要求。由 2、并行自适应盲均衡算法
于其优异的线性相位特性和无条件稳定性,FFA算法广泛应用于 设发送的信息符号为s(n)=a(n)+jb(n),均衡器长度为N,
视频,图像处理和无线通信等许多领域。在一些应用中,例如 均衡器接收到的信号向量为:
高速遥感卫星接收器,4G通信系统,它们对FIR滤波器的吞吐量 X(n)=[x n ,x n-1 ,…,x n-N+1 ] T
要求也由于其较高的数据传输速率而增加,例如蜂窝数据通信 均衡器系数为:
和便携式医疗应用。另一方面,在设备领域,对FIR滤波器的功 W(n)=[w 0 (n),w 1 (n),…,w N-1 (n)] T
耗有严格的要求,并行技术可用于提高FIR滤波器的吞吐量,并 基于随机梯度法的自适应系数更新方程可表示为:
且可用于降低FIR滤波器的功耗,这是其主要的优越性,但通常 (3)
并联结构的数量随着并联级数的增加而显著增加,使得其难以 式 中 μ 为 自 适 应 更 新 步 长 参 数 , 其 误 差 函 数 为
被实际应用于复杂度很高的系统中。如何解决并行FIR滤波器的 。
复杂性,在过去十年中一直是一个重要的主题,然而在FIR滤波 自适应盲均衡算法的公式如下:
T
器的在大多数设计中,并行结构会无法容忍硬件开销。在FFA算 y(LK+i)=W (Lk+i)X(Lk+i) (4)
法的之外,仍有一种较为合适的算法—ISCA算法,采用该算法 将上式进行超前变换,用当前时刻的均衡系数替代下一时
可以获得比FFA算法更良好的硬件资源利用效率,从而改善FFA 刻的均衡系数可得:
T
算法难以适应高复杂度系统的问题。在该算法中,并行滤波通 y(LK+i)≈W (Lk)X(Lk+i)(5)
过快速短卷积来实现。快速短卷积算法最初由ACHAJI在1989年 这种变换方式可以简化迭代过程的计算而且并不会对算法
提出,随后由CHENGC和CHENGC,PARHIKK改进。特别是,当FIR 的性能有明显的影响。式中k为对应于n的在L通道并行下的时间
滤波器的长度很大时,这种基于ISC的线性卷积结构被替换可节 索引。对上式(5)展开可得到:
省大量的硬件成本。
2、并行均衡算法 (6)
随着对高速数据传输需求的日益增长,现有的数字调制 流水线延时问题在算法的硬件实现阶段是无法避免的,所
解调技术已显得捉襟见肘,难以满足大众的高需求,太赫兹通 以在建模过程中必须予以考虑。在该系统中,误差反馈环路的
信正是于此时走进公众视线。目前对于太赫兹通信的研究主要 流水线延时定义为D 1 ,由于收敛后的系数在自适应更新中有着
集中在太赫兹高速信号处理中,却忽视了信号传输的准确性问 稳定缓慢的特征,故式(6)可近似表示为如下形式:
题。目前大多数的学术文献中没有考虑均衡器,而实际通信
中,码间串扰的问题是普遍存在的。造成码间串扰的原因多种 (7)
多样,诸如有限长度截断和采样周期偏差等。想要恢复原始信 组合短卷积来进行系数自适应更新可实现并行化,所需付
号就需要采用均衡化技术来减少甚至消除这些码间串扰所带来 出的硬件代价较低。取L=8,LA=2。如下页图1所示为最终得到
的不利影响。但由于实际信道及器件的非线性特征,无法准确 整体实现结构,描述了基于短卷积的并行自适应盲均衡算法流
观测其所造成的影响,同时考虑到信道自身的额时变特性,均 程。
T
T
衡算法必须具备自适应性,在本文中选用并行自适应盲均衡算 通过矩阵Q 和矩阵A 预处理,d 1 -d 6 为流水线延时,通过
T
法。 X q (n)=X p (n)H(n)进行滤波,通过矩阵P 对数据处理组合可得到
最终均衡结果。这里需要限定流水线延时的条件:
三、算法基本原理 D 1 =d 1 +d 2 +d 3 +d 4
1、迭代短卷积算法
在并行化滤波算法中,相较FFA算法对硬件资源利用 四、算法仿真
率更高的是迭代短卷积算法(Iterated Short Convolution 所设计的算法的有效性及性能需要通过仿真的检验,针对
网络电信 二零一九年六月 57