Page 31 - 网络电信2016第3期
P. 31
大数据分析
应用驱动的大数据挖掘
李涛 刘峥 周绮凤
大数据时代的发展 大数据分析取得胜利。大数据已经融入各行各业,大数据时代
数字化变革推动信息技术(IT)和通信技术(CT)的飞速 已经来临。
发展,人类社会所产出的信息总量呈爆发式增长。一方面,各
行各业在日常运作中借助IT产生和存储了海量的运营数据,如 大数据的特点与理解
商业运营、金融证券、健康医疗、科学研究等,分布在世界各
地的10000多家沃尔玛超市1h需要处理百万条以上顾客的消费记 1.大数据的特点
录,数据量高达2.5PB,欧洲的大型电子对撞机每天产生的记录 目前业界普遍用4V的特点来衡量大数据所带来的挑战[7],
有500EB;另一方面,CT使得全世界数十亿用户通过互联网链接 从数据本身的表现形式上描述了大数据与以往部分抽样的“小
在一起。目前全球移动互联网的流量每月约4.2EB,思科预计: 数据”的主要区别。
2019年全球移动互联网的流量会增长到每年292EB。 大量(Volume):大数据的体量巨大,从TB级别跃升到PB
这些海量数据被称为大数据。维 级别;
基百科对大数据的定义是:“ 大数据
是由于规模、复杂性、实时性而导致 多样(Variety):大数据面对
的无法在一定时间内用常规软件工具 数据类型种类繁多,例如地理位置
对其进行获取、存贮、搜索、分享、 等结构化数据,事件日志等非结构
分析、可视化的数据集合”。知名技 化数据,还包括图片、视频等多媒
术咨询公司Gartner对大数据的定义 体数据等;
是:“ 大数据是需要新处理模式才能
具有更强的决策力、洞察发现力和流 高速(Velocity):大数据产
程优化能力的海量、高增长率和多样 生和累计的速度快,要求处理速度
化的信息资产”。 快,做到实时分析,和传统的离线
大数据技术的发展使得收集、 方式的数据挖掘技术有着本质的不
处理、管理、分析在各行各业产生的海量数据成为可能:企业 同;
利用大数据技术理解客户的属性和行为,可以提供给客户更好
的个性化服务,并可以利用大数据技术改善和优化商业流程, 价值(Value):大数据所蕴含
提高企业的运营效率;政府通过大数据技术来更智能的管理城 的价值密度低,但有效价值高,合
市,包括公共交通、医疗服务、可持续性发展等;超市可以向 理利用低密度价值的数据并对其进行正确、准确的分析,将会
用户推销所需的商品;车险公司可以知道客户的驾驶水平;甚 带来巨大的商业和社会价值。
至2012年的美国总统大选,奥巴马的竞选团队也是依赖卓越的 从现有的一些大数据挖掘应用案例出发,大数据挖掘的流
程可以总结为:
(1)准确定义大数据挖掘问题的目标;
(2)获取大数据,并对收集到的大数据进行数据清洗等预
处理;
48 网络电信 二零一六年三月