Page 12 - 网络电信2021年9月刊上
P. 12

运 营 商 动 态

                                                                     其中,D为需要预测的数据量;D p 为每个用户使用的数据
                                                                 量;p为用户数量。每个用户互联网相关行业消耗的数据量D p 统
                                                                 计难度小,可由相关APP或移动端设备获得。同时互联网产品的
                                                                 用户增长速度已经比较稳定,统计用户数量p同样比较简单。由
                其中,D n 为预测年份的数据量;D n-1 为前一年的数据量;p n
            为数据量增长率;q为数据类型指数;a i 为专家建议的影响因                       前面分析可知,互联网产业的数据绝大部分都是非结构化的数
            素,当专家建议的影响较多时,需要将多种因素相乘。前面分                          据,故本模型不再区分数据类型。当然,此模型也适用于增长
            析可知,大部分行业结构化数据是线性增长,故预测结构化数                          规模稳定的工业制造业。
            据时q为1;由于非结构化数据种类多且数据量巨大,增长速率                             3. 两种模型的比较
            一般不是线性的,经过迭代拟合,这里给出一个q的参考值为                              用户拟合模型的优势比较明显:计算简单,数据易于统
            2,相关专业的专家可以根据专业经验自行修改。                               计,其预测结果比较接近真实值。但其缺点也比较明显,就是
                用专家拟合法对电信运营商某平台网络数据的数据量进行                        使用范围比较窄,使用的条件比较苛刻。只适用于数据和用户
            了预测。2018-2020年数据为此平台每日平均数据量的实测数                      数量关系紧密的行业,且要求其用户量或者用户变化的趋势比
            据;2020年数据量为前3季度实测数据量和第4季度的预测值;                       较稳定,容易预测和统计。
            2021年数据量为利用专家拟合模型预测数值,其中,p为0.1,q                         专家拟合模型的优点是覆盖的行业广,只要可以找到相关
            为2,a为1.4。                                            专业的数据专家给出相关参数,就可以比较准确拟合这个专业
                2018-2021年每日数据量如图1所示。可以看出,2021年整                 的数据量,此外还可以预测不同类型数据的数据量。缺点是计
            体数据量增长明显,这是由5G进一步普及所带来的数据量爆发造                        算比较复杂,需要较多的统计手段对基础数据进行加工得出相
            成的。                                                  关的增长率,比较依赖专家建议,主观因素较高。两种预测模
                专家拟合法适用于用户行为和增长模式都无法严格量化的                        型特点比较鲜明,可以根据具体的需求综合考虑两种模型的优
            新兴技术和产业。例如本文提到的工业制造业,尤其是重工业                          缺点进行预测。
            领域,5G的技术加成将为该领域的数字化和智能化提供飞速发                             以上两种模型都是从运营商的实际生产的相关模型改进而
            展的动力,数据发展速度将突破线性增长,很可能达到指数级                          来,尽管在模型构建时尽可能地考虑了多种行业的数据特点,
            增长,利用专家拟合法能够更准确地描述其增长趋势。                             但依然不可避免有一定的局限性。用于构造模型的数据目前仅
                2. 用户指数方法                                        仅来自于一家运营商的统计,由于运营商无法对数据所属的产
                针对互联网这类2C业务的产业,由于其用户量与数据量关                       业精细划分,也无法深入研究各行业的数据特点。因此,本文
            系紧密,可以考虑使用用户量来描述其特性。                                 所涉及的预测模型,在对于其它行业数据预测方面还存在一些
                D=D p ·P                                         不足。若想进一步深入精细地预测各行业的数据,还需要深入
                                                                 调研相关行业的数据特点。
                                                                     本文旨在探索和研究构建一个能够全行业适用的海量数据
             表 2 某平台 2018-2021 年每天网络数据量
                                                                 预测模型的方法论。这里建议更多地从模型构建的方法和角度
                                                                 去考虑如何能够更全面、更合理、更准确地构建预测模型。

                                                                     三、结束语
                                                                     海量数据的概念是从大数据衍生而来的,与大数据相比,
                                                                 海量数据来源更多样、种类更多样、数据量更大、用途更模
                                                                 糊,这也为海量数据的预测增加了难度。经过研究发现,不同
                                                                 的业务对数据的要求和数据组成是不同的,但数据量增长的趋
                                                                 势是明显且稳定的。为了更准确地预测,我们按照产业的业务
                                                                 特点和数据本身的特点进行了研究和分析,提出了两种预测模
             图 1 某平台 2018-2021 年每日数据量(TB)
                                                                 型。本文提出了两种预测海量数据的方法为相关问题提出了解
                                                                 决思路。两种模型各有特点,可以根据所研究领域的特点选择
                                                                 使用一种或两种进行海量数据的预测。



                                                                 参考文献:
                                                                 [1] 中国互联网络信息中心. 第45次中国互联网络发展状况统
                                                                     计报告[R]. 2020(4).
                                                                 [2] 陈荆花,包枫叶,蒋寅. 浅析未来车辆网中运营商通道能
                                                                     力的挑战与创新[J]. 电子技术应用,2019(9).



            16                                         网络电信 二零二一年九月
   7   8   9   10   11   12   13   14   15   16   17