Page 40 - 网络电信2019年6月刊下
P. 40

二、主流并行算法概述                                       Algorithm,ISCA)。该算法将部分乘法单元用加法单元和延迟
                1、并行滤波算法                                         单元替代,同时使用快速卷积来消减子滤波器的数量,同时尽
                在实际应用中,如果通信速率不是很高,则并行化算法                         量保证子滤波器具有系数对称性。乘法器的数量需要通过依赖
            可以通过加法共享来实现。其可以2Gbps到5Gpbs的速度运行,                     系数对称性来优化。ISCA算法方程如下:
            并且消耗最少的硬件资源。然而,随着通信速度的增加,并行
            通道的数量增加,纯粹的加法共享方法在某些情况下由于数据                                                                              (1)
            维度过高,计算开销过大,容错性低等因素而失去实际应用价                              在式(1)的基础上可以进一步推导出多级迭代的公式,适
            值。关于并行化处理,快速有限脉冲响应算法(FFA)和迭代短                        用于并行级数较高的情况。
            卷积算法(ISCA)是用于高速环境的两种并行滤波算法。                              多级迭代的公式如下:
                FFA算法的本质是一个有限脉冲响应滤波器。它将原始串行
            序列经过串并转换后输入到并行输入序列中,然后类似地将滤                                                                              (2)
            波器系数分解成类似的并行序列。在被分解成并行序列之后,                              式中:N=Mk=mnk;
            并行化以矩阵形式表示。该算法不需要在基于循环或非周期卷
            积方法中使用一般重叠技术。可以显着降低硬件性能要求。由                              2、并行自适应盲均衡算法
            于其优异的线性相位特性和无条件稳定性,FFA算法广泛应用于                            设发送的信息符号为s(n)=a(n)+jb(n),均衡器长度为N,
            视频,图像处理和无线通信等许多领域。在一些应用中,例如                          均衡器接收到的信号向量为:
            高速遥感卫星接收器,4G通信系统,它们对FIR滤波器的吞吐量                           X(n)=[x n ,x n-1 ,…,x n-N+1 ] T
            要求也由于其较高的数据传输速率而增加,例如蜂窝数据通信                              均衡器系数为:
            和便携式医疗应用。另一方面,在设备领域,对FIR滤波器的功                            W(n)=[w 0 (n),w 1 (n),…,w N-1 (n)] T
            耗有严格的要求,并行技术可用于提高FIR滤波器的吞吐量,并                            基于随机梯度法的自适应系数更新方程可表示为:
            且可用于降低FIR滤波器的功耗,这是其主要的优越性,但通常                                                                            (3)
            并联结构的数量随着并联级数的增加而显著增加,使得其难以                              式 中 μ 为 自 适 应 更 新 步 长 参 数 , 其 误 差 函 数 为
            被实际应用于复杂度很高的系统中。如何解决并行FIR滤波器的                                              。
            复杂性,在过去十年中一直是一个重要的主题,然而在FIR滤波                            自适应盲均衡算法的公式如下:
                                                                             T
            器的在大多数设计中,并行结构会无法容忍硬件开销。在FFA算                            y(LK+i)=W (Lk+i)X(Lk+i)                         (4)
            法的之外,仍有一种较为合适的算法—ISCA算法,采用该算法                            将上式进行超前变换,用当前时刻的均衡系数替代下一时
            可以获得比FFA算法更良好的硬件资源利用效率,从而改善FFA                       刻的均衡系数可得:
                                                                              T
            算法难以适应高复杂度系统的问题。在该算法中,并行滤波通                              y(LK+i)≈W (Lk)X(Lk+i)(5)
            过快速短卷积来实现。快速短卷积算法最初由ACHAJI在1989年                         这种变换方式可以简化迭代过程的计算而且并不会对算法
            提出,随后由CHENGC和CHENGC,PARHIKK改进。特别是,当FIR               的性能有明显的影响。式中k为对应于n的在L通道并行下的时间
            滤波器的长度很大时,这种基于ISC的线性卷积结构被替换可节                        索引。对上式(5)展开可得到:
            省大量的硬件成本。
                2、并行均衡算法                                                                                             (6)
                随着对高速数据传输需求的日益增长,现有的数字调制                             流水线延时问题在算法的硬件实现阶段是无法避免的,所
            解调技术已显得捉襟见肘,难以满足大众的高需求,太赫兹通                          以在建模过程中必须予以考虑。在该系统中,误差反馈环路的
            信正是于此时走进公众视线。目前对于太赫兹通信的研究主要                          流水线延时定义为D 1 ,由于收敛后的系数在自适应更新中有着
            集中在太赫兹高速信号处理中,却忽视了信号传输的准确性问                          稳定缓慢的特征,故式(6)可近似表示为如下形式:
            题。目前大多数的学术文献中没有考虑均衡器,而实际通信
            中,码间串扰的问题是普遍存在的。造成码间串扰的原因多种                                                                              (7)
            多样,诸如有限长度截断和采样周期偏差等。想要恢复原始信                              组合短卷积来进行系数自适应更新可实现并行化,所需付
            号就需要采用均衡化技术来减少甚至消除这些码间串扰所带来                          出的硬件代价较低。取L=8,LA=2。如下页图1所示为最终得到
            的不利影响。但由于实际信道及器件的非线性特征,无法准确                          整体实现结构,描述了基于短卷积的并行自适应盲均衡算法流
            观测其所造成的影响,同时考虑到信道自身的额时变特性,均                          程。
                                                                              T
                                                                                     T
            衡算法必须具备自适应性,在本文中选用并行自适应盲均衡算                              通过矩阵Q 和矩阵A 预处理,d 1 -d 6 为流水线延时,通过
                                                                                                T
            法。                                                   X q (n)=X p (n)H(n)进行滤波,通过矩阵P 对数据处理组合可得到
                                                                 最终均衡结果。这里需要限定流水线延时的条件:
                三、算法基本原理                                             D 1 =d 1 +d 2 +d 3 +d 4
                1、迭代短卷积算法
                在并行化滤波算法中,相较FFA算法对硬件资源利用                             四、算法仿真
            率更高的是迭代短卷积算法(Iterated  Short  Convolution                所设计的算法的有效性及性能需要通过仿真的检验,针对

                                                       网络电信 二零一九年六月                                            57
   35   36   37   38   39   40   41   42   43   44   45