Page 13 - 网络电信2019年6月刊上
P. 13
运 营 商 专 栏
其中,mnx 表示第 m 个频点的第 n 个参数。如 F1D1D2FDD 的算法模型与评估结果对算法模型进行现网部署与测试验证。
900MHz 的组网结构包含 4 个频点,每个频点如果有 12 个参数配 1.现网数据采集与预处理
置数据,则 X 矩阵大小为 (4,12)。 采集现网中的数据,主要包括:MR、影响负荷的配置数据、
性能指标参数 Y 为小区组负载均衡的判定指标数据, 与负荷相关的 KPI 与 PM 数据等。测量报告数据主要来自 UE 和
可 包 括: 小 区 组 所 包 含 每 个 频 点 的 RRC(radio resource eNode B 的物理层、RLC 层以及在无线资源管理过程。影响负荷
control,无线资源控制)最大连接用户数、上行 PRB(physical 的配置数据指主要用于系统中无线资源控制子层完成诸如小区
resource block,物理资源块)利用率和下行 PRB 利用率等参数, 选择 / 重选及切换等事件触发的参数。与负荷相关的 KPI 与 PM
包括 m 个频点,每个频点有 k 个参数,矩阵大小为 (m, k) ,可 数据主要包括网络考核负荷所用的关键指标:如 RRC 最大连接
表示为: 用户数、上行 PUSCH 利用率、下行 PDSCH 利用率等。
为了满足机器学习算法的多维数据需求,需从不同设备厂
商以及不同网元采集数据,这样采集的数据格式差异大、数据
相关性复杂,关联去重之后实际可用格式化数据减少。本文所
选取的小区场景为 F1D1D2FDD 900 MHz,采集南宁市中存在负
荷不均衡的 5 个网格共 700 多个小区连续一个月的数据,以 15
其 中,y mk 表 示 第 m 个 频 点 的 第 k 个 负 载 指 标 数 据。 如 min 为粒度采集测量报告数据,配置参数以天为粒度进行采集,
F1D1D2FDD 900MHz 的组网结构包含 4 个频点,每个频点有 3 个 性能数据以 15 min 粒度进行采集,对处理后的格式化数据进行
指标数据,则 Y 矩阵大小为 (4, 3)。 随机划分,按照 8: 2 的比例划分训练集和测试集,现网采集数
研究性能指标与配置参数的关系,将此问题建模为多变量 据预处理结果见表 1。
回归问题。使用全连接神经网络算法模型学习回归问题的内在
表 1 现网采集数据的预处理结果
关系,使用训练数据训练神经网络模型。输入为 X,读入 X 中的
数据,转换为列矩阵,作为神经网络的输入,同理转换 Y 矩阵
为列矩阵,作为神经网络的输出。 回归问题的输出 Y 含有多个
变量,因此依据此问题设计代价函数为:
其中,y i 是样本数据,而 y' i 是神经网络计算的预测值。
将各个变量的 MSE(mean squared error,均方误差)的
平均值作为损失函数,通过训练模型、调整权重和偏置使得网 2.模型训练与结果分析
络的代价函数达到最小,由此得到训练稳定的神经网络模型。 根据上文提出的小区场景划分方法,使用 MR 数据对小区场
(4) 配置参数寻优 景进行划分,场景自动划分采用 K-means 聚类算法,算法的时
使用优化搜索算法在得出的训练模型中搜索使网络性能参 间复杂度为:O(t×k×m×n),空间复杂度为:O(m×(n+k)),
数达到最优的参数配置,采用爬山算法进行局部最优解的搜索, 其中,t 为迭代次数,k 为簇的数目,m 为特征数,n 为样本数。
将得出的参数配置部署到现网中并测试其性能。优化配置输出 一般 t、k、m 均可认为是常量,所以时间和空间复杂度可以简
过程如图 4 所示,具体算法实现为:从当前的节点开始,和周 化为:O(n),即线性的。对每个类别的 MR 统计数据求均值,各
围的邻居节点的值进行比较。如果当前节点是最大的,那么返 场景类别 MR 统计数据均值分布如图 5 所示。
回当前节点,作为最大值(即山峰最高点);反之用最高的邻
图 5 各场景类别 MR 统计数据均值分布
居节点替换当前节点,从而实现向山峰的高处攀爬的目的。如
此循环直到达到迭代次数。在迭代次数内,得到的可能只是局
部最优解,并非全局最优解。
图 4 优化配置输出过程
对所划分的 4 类小区场景分别进行配置参数与性能参数的
关系模型训练,利用深度学习算法模型学习配置参数与性能指
标参数的内在关系,采用均方误差(MSE)、平均绝对误差(mean
absolute error,MAE)以及 R-Squared 对深度学习算法训练
得到的模型进行评价。DNN 算法的复杂度主要由隐藏层、隐藏
三、现网测试验证 单元以及样本的数量决定。DNN 模型评价指标见表 2,评价结果
为验证算法的有效性与可实施性,需采集现网的数据集对 显示,深度学习算法对数据具有较好的拟合度,预测数据与真
本文提出的方案进行模型训练与结果评估,然后依据训练生成 实数据的误差较小。
14 网络电信 二零二零年六月