Page 17 - 网络电信2018年9月刊下
P. 17

二、数据挖掘与精准营销的关系                                   户。(样本数据:选择已办理移动宽带的客户;夜间常驻基站:模
                (1)数据挖掘是实现精准营销的科学手段。营销的理                         型通过汇总用户近3个月的语音清单和流量清单(有位置信令数
            论依据中强调精准营销要以客户为导向,在合适的时间、合适                          据用位置信令数据),分析其夜间时段(晚上10点~早上5点)的
            的地点满足客户个性化需求,方便客户购买,降低客户购买成                          基站使用情况,找出综合通讯时长(语音通话时长+流量上网时
            本,使客户“让客价值”最大化。实现营销目标需要具体分析                          长)最长的基站为其夜间常驻基站。
            与之相关的数据。在数据不够丰富,量不够大,方法不够先进                              (2)双卡用户识别模型。双卡用户识别模型建模方法为典
            时,传统方法是通过业务经验,逻辑推理进行营销。而随着数                          型的分类算法。典型的挖掘算法流程包含数据预处理,数据清
            据及技术的发展,实现上述营销目标不再是业务经验,而是通                          洗,数据探索,变量特征选择,构建模型,模型评价,模型部
            过数据挖掘技术将散乱的数据进行预处理,探索,建模发现并                          署。如果模型评价效果不理想,进行模型调优。文章研究的低
            识别数据与目标间的关系模式从而科学的指导决策营销方向,                          流量客户是否是双卡客户,是否被第二卡槽分流导致流量消费
            实现营销目标。                                              较低。本次双卡建模使用spssClementine12.0工具,配合SQL
                (2)精准营销的“精”和“准”依赖数据挖掘。精准                         进行使用。开发人员将宽表数据放到数据挖掘库下的表中,从
            营销要达到的营销效果是“精”和“准”,那么可衡量的方法                          数据源节点直接调取。对宽表数据进行数据审核、变换及各种
            才是其核心思想。那就要洞察并具体确定营销的客户是谁?消                          直方图散点图的探索。最终通过特征变量选择节点结合前期业
            费习惯如何?偏好和需求是什么?以往靠业务经验和直觉以及简                         务经验选择建模变量,最终通过逻辑回归及决策术算法进行建
            单的数据统计已经无法实现,只有依赖数据挖掘算法及技术才                          模。经过模型评价最终选取决策树C5.0作为本次双卡建模方
            能实现。随着数据的丰富,开源软件的发展,数据挖掘技术已                          法。(后期会考虑用Python工具集成的方法进行建模。此处不再
            能够满足目标客户的识别,用户消费偏好识别,渠道偏好识别                          累述)。
            等问题,因此说精准营销依赖数                                                                   (3)Wi-Fi分流识别模型。
            据挖掘。                                                                         判断用户在各时段是否受WiFi影
                                                                                         响,模型中剔除功能机用户、终
                三、目标用户识别模                                                                端无WiFi功能用户、低流量(DOU
            型库                                                                           <10MB)和有中国移动宽带的家
                “低流量客户流量拉升营                                                              庭成员。数据探索:①Wifi用户
            销”。低流量用户群体:从运营                                                               ARPU、DOU、DARPU、手机上网
            商经营分析系统(BASS)数据库中                                                            时长均高于非Wifi用户。②高消
            提取流量使用的用户数据,去掉                                                               费、高流量、4G用户、订购安心
            流量使用极高值和极低值,文章                                                               包闲时包用户更善于使用WiFi满
            去掉前后各1%的极值数据。然后                                                              足流量需求。建模过程:①判断
            对剩余用户流量数据进行离散处                                       用户流量比:用户在该时段流量比不小于阈值FR,说明用户该
            理。通过数据统计,0~5M用户占比为8.46%,5~300M的用户                    时段不受WiFi影响,否则进入下一步骤;流量比:一个时段内,
            占比53.44%,300兆以上的用户占比36.1%。                           用户手机上网流量与各时段平均流量的比,不同时段流量比不
                最终确认流量消费较低的用户群体为5~300兆的用户群                       同。流量比越小,说明用户本时段内使用的流量越少,被WiFi
            体。对该部分群体定义流量消费较低,进行拉升精准营销。(低                         分流的可能性越大。②判断用户上网时长:用户在该时段流量使
            于5兆及高于300兆用户群体另外进行沉默客户激活营销,高于                        用时长不小于阈值T,说明用户该时段不受WiFi影响,否则可能
            300兆用户群体另外进行保有及提升营销,这里不做研究)。                         受WiFi影响。手机上网时长:一个时段内用户使用手机上网流
                低流量客户群体分两部分进行研究。一部分客户流量消费                        量的时长。上网时长越小,被WiFi分流的可能性越大。阀值确
            较低是客户真实流量需求或消费能力低导致。另一部分是因为                          定:结合分布及减小误判风险,选取各时段三类用户均值作为阈
            被家庭宽带、二卡槽(多终端)、wifi分流导致用户移动号码流                       值。
            量消费较低,而真实消费并不低。不同的目标客户最终营销推                              (4)真实低流量用户识别模型。主要是从用户流量需求
            荐的产品及政策不同,所以低流量客户流量拉升营销的目标客                          角度出发,排除上述疑似分流的用户群体,同时结合用户流量
            户识别模型库包含4个模型,分别是家庭宽带用户识别模型,双                         需求强烈度子模型进行确定。建模思路:流量需求强烈程度,采
            卡客户识别模型,wifi分流客户识别模型,真实低流量用户识                        用熵值法计算。
            别模型。                                                     ①属性选择:流量频次,APP个数(总的APP个数),APP种类
                (1)家庭宽带识别模型。通过探索低流量客户的GPRS上                      个数(Label_name2),总流量。
            网行为数据与其夜间常驻基站的关系数据识别移动号码使用竞                              ②计算方法:将每个属性去极值,熵值化,标准化处理后计
            争对手宽带用户以及移动号码并未使用任何宽带既宽带空白用                          算(标准化后的流量频次+标准化后的总的APP个数+标准化后的


                                                       网络电信 二零一八年九月                                            23
   12   13   14   15   16   17   18   19   20   21   22