Page 31 - 网络电信2016第3期
P. 31

大数据分析

应用驱动的大数据挖掘

李涛 刘峥 周绮凤

      大数据时代的发展                     大数据分析取得胜利。大数据已经融入各行各业,大数据时代
      数字化变革推动信息技术(IT)和通信技术(CT)的飞速  已经来临。
发展,人类社会所产出的信息总量呈爆发式增长。一方面,各
行各业在日常运作中借助IT产生和存储了海量的运营数据,如           大数据的特点与理解
商业运营、金融证券、健康医疗、科学研究等,分布在世界各
地的10000多家沃尔玛超市1h需要处理百万条以上顾客的消费记         1.大数据的特点
录,数据量高达2.5PB,欧洲的大型电子对撞机每天产生的记录           目前业界普遍用4V的特点来衡量大数据所带来的挑战[7],
有500EB;另一方面,CT使得全世界数十亿用户通过互联网链接    从数据本身的表现形式上描述了大数据与以往部分抽样的“小
在一起。目前全球移动互联网的流量每月约4.2EB,思科预计:     数据”的主要区别。
2019年全球移动互联网的流量会增长到每年292EB。              大量(Volume):大数据的体量巨大,从TB级别跃升到PB
      这些海量数据被称为大数据。维               级别;
基百科对大数据的定义是:“ 大数据
是由于规模、复杂性、实时性而导致                                                             多样(Variety):大数据面对
的无法在一定时间内用常规软件工具                                                       数据类型种类繁多,例如地理位置
对其进行获取、存贮、搜索、分享、                                                       等结构化数据,事件日志等非结构
分析、可视化的数据集合”。知名技                                                       化数据,还包括图片、视频等多媒
术咨询公司Gartner对大数据的定义                                                    体数据等;
是:“ 大数据是需要新处理模式才能
具有更强的决策力、洞察发现力和流                                                             高速(Velocity):大数据产
程优化能力的海量、高增长率和多样                                                       生和累计的速度快,要求处理速度
化的信息资产”。                                                               快,做到实时分析,和传统的离线
      大数据技术的发展使得收集、                                                    方式的数据挖掘技术有着本质的不
处理、管理、分析在各行各业产生的海量数据成为可能:企业                                            同;
利用大数据技术理解客户的属性和行为,可以提供给客户更好
的个性化服务,并可以利用大数据技术改善和优化商业流程,                                                  价值(Value):大数据所蕴含
提高企业的运营效率;政府通过大数据技术来更智能的管理城                                            的价值密度低,但有效价值高,合
市,包括公共交通、医疗服务、可持续性发展等;超市可以向        理利用低密度价值的数据并对其进行正确、准确的分析,将会
用户推销所需的商品;车险公司可以知道客户的驾驶水平;甚        带来巨大的商业和社会价值。
至2012年的美国总统大选,奥巴马的竞选团队也是依赖卓越的            从现有的一些大数据挖掘应用案例出发,大数据挖掘的流
                                   程可以总结为:
                                         (1)准确定义大数据挖掘问题的目标;
                                         (2)获取大数据,并对收集到的大数据进行数据清洗等预
                                   处理;

48 网络电信 二零一六年三月
   26   27   28   29   30   31   32   33   34   35   36