Page 35 - 网络电信2016第6期
P. 35
解决方案
络部署中发挥越来越重要的作用。此外,行业应用正从窄带向 接下来以业务并发度探寻实例来阐述在蜂窝网络系统中如
宽带演进,除了语音通信外,数据、视频传输需求逐步增加。 何应用大数据来解决问题。在该实例中,我们分析各种常见业
LTE的100Mbit/s高速数据传送能力,可以更好地服务于政务 务在不同场景不同时间的并发度,最终得出不同区域的业务并
网、公共安全和应急救灾等行业。因此,利用新一代无线技术 发以及对网络资源的消耗情况,并据此提出网络优化策略。
来实现行业应用,已成为一个发展趋势。
大数据时代的业务并发度分析
随着分布式计算和云平台的逐步实现,作为云服务的关键
应用之一,大数据应用具备了大规模发展的条件。运营商的大 1.应用场景
数据业务正从分散孤立系统向统一的标准化平台方向发展、从 随着通信技术的飞速发展和移动终端的功能逐渐丰富,蜂
数据的采集、存储向检索和挖掘的方向发展。在网络大数据的 窝网络中的数据业务流量迅猛增长,移动互联网下终端用户需
收集与预处理方面,分布式存储方案、内存数据库技术将成为 求更加多样化和复杂化,这也促使移动互联网由传统的单业务
主流技术;Hadoop和一体机成为主流的数据分析平台。 向着多业务平台发展。多业务的出现使得网络数据更趋向于复
杂多样与结构各异,这给用户的行为分析带来了很大的困难和
根据以往的研究,蜂窝网络的承载情况随着通信协议的发 挑战。与此同时,由于业务种类的繁多,分析某一种业务对于
展也发生着巨大变化。根据某一地区的真实历史数据分析可以 整体蜂窝网络影响甚至微乎其微,因此为了提高网络的承载能
得知,全市所有基站的平均吞吐量在2G、3G和4G网络的时代是 力,需要科学准确地分析各数据业务之间的并发性。
有着很大区别的,具体数值如图2所示。 由图3可见,由于目前蜂窝网络用户数和终端数快速增长,
以及业务场景多种多样,数据种类也趋于全面,包括用户使用
图2 不同制式下基站平均吞吐量 各业务的时间信息、位置信息、链接次数、业务量大小等,因
此,用户—— 业务网络资源之间的映射十分复杂,海量的数据
具有极低的价值密度,如果仅仅对某一部分数据进行分析,不
能反映整体网络情况,所具有的价值意义也就很小。
此外,无线侧采集到的数据格式并不统一,应用传统数据
库无法建立统一的数据表结构。根据数据的以上特点,我们采
用Hadoop平台进行数据的预处理与所有算法的执行,实现了高
效处理非结构化数据。
图3 用户—业务—网络资源之间的映射
根据图2可以看出,发展速度最快并且承载压力最大的信道 2.核心技术
是下行数据信道,而目前国内的4G网络还处于发展初期,吞吐 为了分析不同场景下的海量数据,首先平台应该具有较高
量的增长了已达到将近100%。由此可知,数据业务的有效传输 的数据处理能力。以无线侧的呼叫细节记录(CDR)数据为例,
是蜂窝网络的核心难题。 某地区全市全天CDR数据条数达到千亿数量级,数据体积约为
70GB,连续一个月的数据量将达到2TB,如果空间维度扩展到全
此外,随着移动互联网、物联网的发展以及4G技术的逐 国,时间维度扩展到几年,这样的数据量是传统数据库和单机
渐普及,无线通信网络的各种功能需求也日益扩大,用户的网 环境的处理能力远远不能达到的,而以Hadoop为代表的大数据
络行为也随之发生改变,所产生的数据体积也达到了新的数量 处理平台则可以轻松应对。
级。因此,如何利用有限的蜂窝网络资源,应对大数据时代的 其次,平台能够处理并管理非结构化数据。非结构化数据
挑战,是当今通信领域的一个重要课题。 相对于结构化数据而言,不方便用数据库二维逻辑表来表现的
数据即称为非结构化数据,包括所有格式的办公文档、文本、
2.有效的网络优化 图片、标准通用标记语言下的子集XML、HTML、各类报表、图像
当今的蜂窝网络的发展速度明显慢于基站吞吐量的增长,
而用户日益丰富的行为对蜂窝网络的承载能力提出了更高的要
求。可见,优化网络,提升网络负载能力已经成为一个亟待解
决的问题。
我们已经提到,大数据时代的到来使得人们的思维方式发
生了巨大的变革,数据驱动了决策制定,因此对蜂窝网络的优
化策略正是通过对蜂窝网络中产生的数据分析处理来制订。同
时,蜂窝网络系统本身就是一个巨大的数据仓库,我们可以从
中采集到丰富的数据,通过对这些数据的分析,可以识别用户
的地理位置,洞察客户接触不同信息的渠道,了解用户的各种
网络行为。常用的分析方法包括:预测业务流量、探寻不同业
务之间的关联、探寻不同业务模型下的资源瓶颈等等。
62 网络电信 二零一六年四月