Page 20 - 网络电信2018年4月刊上
P. 20

运 营 商 专 栏

            性和高效性。                                                   (1)互联网业务维度占比分析
                -基于ORC文件极限存储模式,对比传统方法极大地减少数                          互联网业务类型是网络运营者和广大互联网企业、用户都
            据存储量,并且只需存储1次。普通的HDFS采用的文件格式占用                       非常关心的重要数据,通过相关的数据信息的组合分析可以获
            存储非常大,直接严重影响了数据存储效率,间接延长了数据                          取具有实际指导意义的分析场景,以互联网业务为例可获取域
            处理时间。本优化方案采用了ORC文件存储,有效降低了数据存                        名业务类型占比参考数据。将占总访问量80%以上的域名和产品
            储成本并提升了时间效率,经测试采用ORC格式存储压力是原有                        业务类型进行分类整合并归纳出电商类、通信类、视频类、地
            模式的3.33%。                                            图类、下载类、社交类、音乐类、视频类等20个域名类型。通
                -基于MapReduce框架进行开发,发生任何的格式变化或数                   过域名类型的占比来分析全网资源的业务情况。图4显示主要的
            据异常,只要按照标准MapReduce框架即可实现格式通用,和传                     访问集中在购物类和视频类,二者分别占总访问量的21.28%和
            统方法相比减少了开发维护的工作量。运营维护工作简易,无                          15.74%。
            需专门的数据库维护人员,减少了购置数据库机器和软件许可                           图4 域名业务维度占比分析
            的采购成本。


                五、现网海量DNS数据分析技术优化的效果
                基于上述域名数据分析的技术优化应用,可以对域名查询
            存储的海量流量数据信息进行高效的计算、分析划分。存储的
            域名数据由查询的源地址、域名、解析地址等信息构成,因此
            可以通过对上述类型数据进行按源地址、域名、解析地址等维
            度进行归类。同时再结合网络地址段划分,又可以进行网络维
            度例如宽带网、移动网,或者省网中的各地市网络地址段进行
            划分,实现多个维度的信息区分,包括以下几点:
                -用户维度,以地址进行划分;
                -域名维度,以查询的域名划分;
                -网络维度范围,例如宽带网、移动网以源地址划分,或
                                                                     (2)某一业务类型维度的排名分析
            者不同地市的城域网以网络地址段进行划分;
                                                                     通过DNS海量数据分析,不仅能实现域名类型和域名所属业
                -业务维度,以各域名所属的业务类型进行划分;
                                                                 务相互组合分析不同域名类型中域名所属的业务量、相关排名
                -其他各维度的组合分类。
                                                                 和占比,还可以通过环比不同周期的域名业务量发现互联网中
                并且可以用报表、图形等多种方式进行呈现。实现DNS数据
                                                                 业务种类变化趋势以及相同业务中的竞争关系变化。对于业务
            多维度分析的效果概述如图3所示。
                                                                 量持续发展快速的域名可以进行相关的资源调整,如图5所示。
             图3 DNS数据分析的效果
                                                                  图5 视频类业务不同网站的访问分析












                                                                  图6 域名流量监控分析











                                                                     (3)域名流量维度的监控分析
                                                                     对重点关注的域名进行实时流量的监控,及时发现流量的
                                                                 异常变化,如图6所示。


            20                                         网络电信 二零一八年四月
   15   16   17   18   19   20   21   22   23   24   25