您好,欢迎来到爱玩科技网。
搜索
您的当前位置:首页基于数据挖掘的移动通讯消费者行为分析

基于数据挖掘的移动通讯消费者行为分析

来源:爱玩科技网


摘要

随着信息化时代的来临,移动通讯市场的竞争越来越激烈,抢占市场份额、

提高客户与企业之间的黏度是移动通讯企业一直的目标。消费行为分析是客户关系

管理的重要组成部分,传统的分析都是借助于经济学的基本理论进行的,没有进行定量的研究,结果存在一定的局限性。在新技术不断发展的今天,数据挖掘技术作为一项强大的数据分析技术,在客户关系管理中的应用正得到越来越多人的关注。在以客户为中心的竞争环境

中,如果既能拥有大量的信息,就能在激烈的竞争中取得优势。数据挖掘是从大量数据中提取或挖掘知识进行数据分析,从而发现潜在信息的技术。对客户进行细分能够帮助企业从更加深入全面的角度洞察客户、了解客户价值取向,基于这种洞察在合适的时间通过合适的渠道向合适的客户提供量身定做的产品套餐。基于此背景提出了该课题。

如何从大量的消费者消费记录中发现消费者的消费行为,对移动通讯企业提高客户的满意度等有着重要的战略意义。本文基于数据挖掘的移动通信消费者消费行为的研究以数据进行驱动,对移动通讯消费者消费行为进行了相关分析,基于已处理的数据,进行消费者细分。通过K-Means、Two-Step和Kohonen聚类方法,分别进行聚类,最终选择了K-Means的细分结果作为消费者细分准则,得到五类消费者,即重要保持客户、重要发展客户、重要挽留客户、一般价值客户和低价值客户。本文第一章首先阐述了数据挖掘的相关理论,并对消费者行为分析进行分析,第二章阐述了数据挖掘理论,介绍了数据挖掘的特点和数据挖掘的一般过程以及数据挖掘的特点。第三章进行了消费者行为分析,包括客户关系的管理、CRM流程、消费者行为分析和消费者细分的方法,以及移动通讯企业的消费者细分问题。第四章描述了移动通讯消费者细分的案例,进行了数据预处理消费者聚类,以及细分客户消费行为分析。第五章进行了移动通讯消费者的相关性分析,包括消费者购买的相关性消费者消费行为的分析,在第六章进行了总结与展望。 本文在移动通讯消费者购买倾向上共进行了CART算法、CHAID算法和C5.0算法,这三种算法进行处理,最终的二道重要保持客户和年龄关系较大,重要挽留客户和消费频率关系较大,重要发展客户则和最近一次消费时间相关性高,一般价值客户和消费频率与消费金额有关,低价值客户则和性别有一定关系。针对此,在展开营销策划时,可以针对性进行营销。

关键词:RFM、客户细分、数据挖掘、CART算法、消费者行为

ABSTRACT

With the advent of the information age, competition in the mobile communications market more competitive, market share, enhance viscosity between customers and business mobile communications business has been the goal. At the same time, the use of mobile communication more and more consumers, how to find consumer behavior from a large number of consumer spending recorded in the mobile communications business has important strategic significance to improve customer satisfaction.

This paper is the study of consumer behavior mobile communication about data mining, first elaborated the theory of data mining, analysis and consumer behavior analysis, and the resulting data into the sample, perform RFM analysis, consumption records from the consumer, That consumer ID, spending time and amount of consumption to its R, F, M value, the next consumer to provide the data base segmentation, analysis of their value by the consumer, is more straightforward.

Based on the processed data, conduct consumer segmentation. By K-Means, Two-Step and Kohonen clustering methods, were clustering, chose K-Means segments results as consumer segmentation criteria to give consumers five categories, namely important to keep customers, an important development client it is important to retain customers, the general value customers and low-value customers. On the basis of consumer segmentation based on different types were consumer behavior analysis more meaningful.

Since this data has 24785 data, but consumers only 10085, data distribution may not satisfy some algorithms, this mobile consumers to buy CART algorithm were carried out on the tendency, CHAID algorithm and C5.0 algorithms, these three algorithms processing, final important to maintain a large customer and their age, the larger retain customers and important relationship between frequency of consumption, important developments and recent customers are spending time correlation is high, the general value customers and consumption frequency and amount of consumption related, low-value customers are and gender have a certain relationship. For this, in the expanded marketing plan, you can carry out targeted marketing.

In this paper, data-driven, mobile communications consumer spending behavior correlation analysis, corporate marketing planning for the future development of great significance.

Keywords: RFM, customer segmentation, data mining, CART algorithm, consumer behavior

目录

摘要................................................................................................................................ 1 ABSTRACT ....................................................................................................................... 2 1 绪论 ........................................................................................................................... 7

1.1 研究背景 ...................................................................................................... 7 1.2 国内外研究现状 .......................................................................................... 7

1.2.1 数据挖掘的研究现状 ......................................................................... 8 1.2.2 客户消费者行为研究现状 ................................................................. 8 1.2.3基于数据挖掘的客户消费者行为研究现状 ...................................... 9 1.3 研究内容 ...................................................................................................... 9 1.4 本文组织结构 ............................................................................................ 10 2 数据挖掘理论概述 ................................................................................................. 11

2.1 数据挖掘特点 ............................................................................................ 11 2.2 数据挖掘的一般过程 .................................................................................. 11 2.3数据挖掘常用方法 ....................................................................................... 12

2.3.1 决策树方法 ....................................................................................... 12 2.3.2统计分析方法 .................................................................................... 12 2.3.3粗糙集方法 ........................................................................................ 12 2.3.4 贝叶斯网络 ....................................................................................... 13 2.3.5 人工神经网络 ................................................................................... 13 2.3.6遗传算法 ............................................................................................ 13

3 消费者行为分析 ..................................................................................................... 14

3.1客户关系管理 ............................................................................................... 14 3.1.1 CRM目标 .................................................................................................... 14

3.1.2 CRM的体系结构 ................................................................................ 15 3.1.3移动通讯企业实施CRM的优势 ....................................................... 15 3.2 CRM流程 ....................................................................................................... 16 3.3消费者行为分析 ........................................................................................... 17

3.3.1消费者行为 ........................................................................................ 17 3.3.2 消费者行为模式 ............................................................................... 18 3.3.3 消费者行为研究理论基础 ............................................................... 19 3.4消费者细分方法 ........................................................................................... 21

3.4.1 RFM分析 ............................................................................................ 22

3.4.2 客户价值矩阵分析 ........................................................................... 25 3.5 移动通讯企业的消费者细分问题 .............................................................. 26 3.6 本章小结 ...................................................................................................... 27 4 移动通讯消费者细分案例 ..................................................................................... 28

4.1数据预处理 ................................................................................................... 28 4.2消费者聚类 ................................................................................................... 30

4.2.1 K-means聚类 ...................................................................................... 32 4.2.2 Two-Step聚类 .................................................................................... 34 4.2.3 Kohonen聚类 ..................................................................................... 36 4.2.4聚类结果比较 .................................................................................... 37 4.3细分客户消费行为分析 ............................................................................... 38

4.3.1重要保持客户 .................................................................................... 38 4.3.2重要发展客户 .................................................................................... 40 4.3.3重要挽留客户 .................................................................................... 41 4.3.4一般价值客户 .................................................................................... 42 4.3.5低价值客户 ........................................................................................ 43 4.4 实证研究 ...................................................................................................... 44

4.4.1对某省电信运营商客户的细分 ........................................................ 44 4.4.2 细分结果分析 ................................................................................... 45 4.4.3 研究结果的现实意义 ....................................................................... 46

5 移动通讯消费者相关性 ......................................................................................... 47

5.1消费者购买相关性 ....................................................................................... 48

5.1.1CART算法原理 .................................................................................... 48 5.1.2CHAID算法原理 .................................................................................. 49 5.1.3 C5.0算法原理 .................................................................................... 49 5.2消费者消费行为分析 ................................................................................... 50

5.2.1重要保持客户CART消费分析 .......................................................... 50 5.2.2重要挽留客户C5.0消费分析 ........................................................... 52 5.2.3重要发展客户C5.0消费分析 ........................................................... 55 5.2.4一般价值客户CHAID消费分析 ........................................................ 57 5.2.5低价值客户CART消费分析 .............................................................. 59 5.3实证研究的现实意义 ................................................................................... 60 6 总结与展望 ............................................................................................................. 62

6.1总结 ............................................................................................................... 62

6.2展望 ............................................................................................................... 62 致谢.............................................................................................................................. 65 参考文献...................................................................................................................... 66

1 绪论

1.1 研究背景

随着科技的不断进步,中国通信企业经历了2G、3G和现在的4G时代,中国移动通讯的市场环境发生了翻天覆地的变化,形成了现在的移动、电信、联通等大型移动通讯企业为主导,多家小型企业参与的市场局面。同时,中国的改革开放的逐渐深入,中国移动通讯市场逐步向外开放,形成了既有内部竞争又有外部压力的新格局。作为当代的移动通讯产业,提高自己的核心竞争力已成为急需解决的问题。中国作为一个人口大国,并且移动客户端人口数量巨大,所以需要从海量数据中进行数据挖掘,对移动通讯消费者行为进行分析,找出客户需求,从而提高核心竞争力,为实现科学经营打下坚实的基础。

在当下的竞争格局下,移动通讯企业已不再是昔日的以业务为中心,在当下以人为本的社会,以客户为中心已然成为移动通讯企业的核心,对不同类型的客户提供对应的服务,有利于增大客户黏度,从而实现以有限成本获得最大利益。消费者行为分析本质上就是从消费者数据中分析消费者的行为规律,更加深入地了解消费者,开发其价值,为企业带来收益。

数据挖掘技术在当下信息大爆炸的年代有着无可比拟的优势,数据挖掘技术就是从大量随机和有噪声的数据中识别出现在又用的知识(模型或规则)的技术过程,从而把人们对数据的应用从低层次的联机查询操作,提高到决策支持、分析预测等更高层次的应用上。[1]当下已是大数据的时代,数据挖掘技术在当代社会的各个领域都得到了广泛的应用,数据挖掘技术具有计算规模大、算法先进、鲁棒性强等特点,在大量实际工程项目中得到了诸多考验,所以把数据挖掘技术应用在移动通讯消费者行为分析中有较高的可靠性和实用性。

1.2 国内外研究现状

随着互联网的发展,服务业也随之改变,利用消费者的消费记录,分析其潜在的消费可能性,并制定对应的消费方案成为各大企业的一种强有力的竞争手段,大数据广泛应用于客户消费者行为中,国内外对此作了相应的研究,并取得了相应的进展。

1.2.1 数据挖掘的研究现状

数据挖掘技术最早源于19年,随着信息技术大爆炸,国内外对此进行了大量的研究,取得了较为丰硕的成果。数据挖掘技术方法较多,并不是各种算法的一种简单的叠加,而是基于现有的技术基础上融合的提升,国内外大量专家学者对数据挖掘技术进行了完善,其主要方法有:分类、估计、预测、相关性分组或关联规则、聚类、复杂数据类型挖掘等方法。

R.Agrawal和Srikant[1]等人提出了著名的Aprior算法,这种关联规则方法对顾客事务数据中的关联问题做出了较好的诠释,该算法是基于频繁理论的低柜方法,即一种挖掘单维布尔关联规则的一种重要方法;Liu[2]等人提出了AFOPT算法,该算法将树形结构和向量空间结构进行结合产生一种新的数据结构来存储所有与频繁集有关的信息,该方法在一定程度上提高了深度优先挖掘算法的性能;Dong和Li[3]把模式定义为支持度的数据集,支持度增加了两个数据库中的重要性,且我们可以把频繁集看成是模式在空间上的实例。基于此,国外很多公司都对数据挖掘上进行了相应的业务拓展:Infermix公司与1998年收购了在数据挖掘技术上有较高声誉的Red Brick公司,Red Brick公司在关系引擎中通过创建模型完成对数据的分析和挖掘,这些模型可以通过结构查询语言SQL,像普通的表一样被访问和操作;IBM和微软也成立了相应的研究中心进行这方面的工作,一些公司也已经提出了基于数据挖掘技术的商业智能解决方案。

[4]

与国外研究相比,中国直到1993年才由国家自然科学基金启动对数据挖掘等人提出了一种用于数据挖掘的粗糙集产生多重知识库的新方法,改善了分类

的研究项目,这二十二年的高速发展,在数据挖掘领域也取得了较大突破。杨辉的精确性,提高了学习过程的有效性;朱锡钧[5]等人现将USD准结构化,再转换成结构化数据,套用现有数据挖掘方法进行数据挖掘。

1.2.2 客户消费者行为研究现状

市场竞争越来越激烈,客户行为分析得到了相应的重视,这是自1997年产

生的客户关系管理后的一个新研究方向。消费者行为的有效分析,能够有效预测将来对应的消费习惯、消费方式、消费行为,从而有利于优化企业与消费者之间的关系,减少客户流失,增加企业的竞争力。

Fryer D S

[6]

等人提出了一种基于遗传算法的多分类器,来预测消费者购买行

为,通过对购买可能性或购买意识来研究那些是潜在客户及这些客户的消费模式和消费习惯;Bucklin[7]等人运用记录在服务器上的日志文件中点击数据流,判断

访问客户是否决定继续浏览该网站以及网站间浏览的时间跨度;Johnson E J[8]等人利用点击客户消费数据对在线访问及购买行为进行分析,得到经常访问电子商务平台网站的客户购买的可能性较大;赵丹群采用了简单明了的图形将复杂大量的信息呈现给用户,提升用户交互,以便能够交互地分析数据关系;晏创业[9]等人提出将XML和关联规则等数据挖掘算法相结合,可以实现网络数据挖掘的智能检索功能;陈莉[10]等人认为,Internet/www信息检索与数据挖掘中,检索工具是其研究的重点,即如何在海量的图形,图像数据中进行数据分析,将多分辨技术(如子波、多子波)、粗集、SVM、神经网络、模糊算法等相关技术集成。

1.2.3基于数据挖掘的客户消费者行为研究现状

在客户消费行为方法研究上,研究人员突破原有方法,在统计学、集合论、人工智能、粗糙集、信息论等学科基础上,提出了以智能计算为核心的数据挖掘方法。

Euiho suh[11]等人建立了网络匿名消费者购买预测模型,利用关联规则挖掘消费者购买方式并对消费者购买可能性进行判断,实现了网络实时营销方法;Change hung[12]等人基于关联规则和聚类方法,对消费者行为进行预测,该方法首先利用信誉度较好的客户的个人信息及购买数据进行聚类来获得客户基本的信息特征(如:客户性别、年龄、收入、职业、生活习惯等),再将商品与客户特征进行匹配,最后将客户的消费日志信息与商品进行预测与关联分析,得到消费者的动态购买概率;向勇[13]等人提出,以消费者的一般消费行为模式为基础,从个人内在影响因子及外在环境因素两方面入手,建立客户消费行为的库存管理影响预测指标体系,对指标体系进行了实证研究,对客户消费需求进行预测;王振东[14]以网络聚类算法及密度聚类算法为基础,提出了客户消费行为动态网络生成技术的聚类中心点算法(DGICC)和以孤立点客户消费数据为基础的孤立点检测方法;童建飞[15]通过对客户行为研究建立了移动增值业务的模型,并对消费者数据进行关联规则研究,提出了适合电信业务的改进关联算法(BUCT);Alex Berson[16]等人从客户关系管理入手,利用决策树和聚类等数据挖掘算法对客户进行细分,并利用关联分析详细阐述了交叉销售中的应用;Micheline Kanber[17]等人对零售数据进行挖掘,得到数据挖掘有利于发现消费者购买模式和趋势,有助于零售商改进服务质量,取得更大的利润和销售;

1.3 研究内容

本文主要研究客户购买行为的预测模型,提出了客户消费预测挖掘模型,影

响客户消费因子及相应方法,具体如下:

(1)分析影响客户消费的一般因子,如:客户经济影响因子,社会影响因素,客户心理影响因素,客户自身特征影响因子等;

(2)提出客户消费预测的数据挖掘模型;

(3)建立了对客户消费数据重要特征提取的神经网络方法; (4)客户关联分类方法的提出;

(5)提出了基于模糊影响因子的客户消费行为预测的朴素贝叶斯分析方法。

1.4 本文组织结构

本文第一章对当前研究进行了相关分析,总结了数据挖掘领域、客户关系分析领域以及两者相结合领域方向的前沿研究,在不断调研的基础上,进行本研究课题的相关探讨。

本文第二章是对数据挖据理论的简要介绍,第三章则是消费者行为相关理论的极少,以及对已有数据进行RFM处理后的结果进行分析。第四章在第三章已处理好的RFM数据基础上,进行消费者细分,并最终采用K-Means方法,将消费者分为五类,最后对分类的消费者分类分析,采用CART、C5.0和CHAID算法,对其指标的相关性进行分析。

2 数据挖掘理论概述

数据挖掘就是从大量的、不完整的、有噪声的、模糊的、随机的数据中,提

取隐含在其中的、人们事先不知道的、但是有潜在有用的信息和知识的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

2.1 数据挖掘特点

数据挖掘是一门广义的交叉学科,包括了数据库、人工智能、数理统计、并行计算方面的技术,其特点如下:

(1)数据库是数据挖掘的主要对象;

(2)数据挖掘是要发现隐含的、预先未知的信息; (3)数据挖掘出来的信息是有价值的。

在本文中,利用数据挖掘技术,从消费者消费记录中挖掘出我们未知的、隐含的消费者行为,为后期消费者行为进行预测,制定相应的方案,提高企业的收益。

2.2 数据挖掘的一般过程

数据挖掘过程一般可分为六个阶段:

(1) 定义问题:进行数据挖掘之前,需要对当前业务进行相应分析,从而定

义问题的范围、得到计算模型所使用的度量以及定义数据挖掘项目的特定目标;

(2) 准备数据:由于当前数据的存储形式多样,并且数据可以分散在公司的

各个部门并以不同的格式进行存储,并且可能由于操作人员等不确定因素,导致数据出错,所以需要对错误数据(噪声点或异常点)进行删除或插入缺失值;

(3) 浏览数据:数据常有最大最小值、平均值、平均偏差、标准偏差、方差

等几个指标。如:通过查看最大值、最小值和平均值,可以确定数据能不能代表客户或者业务流程,数据库的数据越多,对应的精度和可靠性

就会越高;

(4) 生成模型:通过创建挖掘结构定义要使用的数据列,将挖掘结构链接到

数据源,但是只有对挖掘结构进行处理后,才能包含实际数据; (5) 浏览和验证模型:对模型的性能进行测试,使用不同参数创建多个模型,

对所有模型进行测试,查看那个模型对数据产生最佳结果;

(6) 部署和更新模型:按照新的要求,并在数据扩容的基础上,更新模型。

2.3数据挖掘常用方法

国际学术组织IEEE International Conference on Data Mining(ICDM)于2006年

12月评选出了数据挖掘领域的十大经典算法:C4.5、K-Means、SVM、Apriori、EM、PageRank、AdaBoost、KNN、Naïve Bayes和CART算法。其所有算法可以大致分为:决策树方法、统计分析方法、粗糙集方法、贝叶斯网络、人工神经网络、遗传算法等。

2.3.1 决策树方法

决策树方法就是利用信息论的原理建立起决策树,及信息论方法[18]。决策树

是一种应用广发的数据挖掘分类方法,由于其可以方便地把大量数据进行有目的的分类,转化成为直观的分类规则,典型的决策树方法有C4.5、CART等。

2.3.2统计分析方法

统计分析方法是指对目标数据集中的关系属性进行整理归类并进行解释的

数据挖掘方法,主要李永乐统计学和概率论中的原理和技术[19]。发现数据中的结构是统计学和数据挖掘的共同的目标,而数据库的字段项中的两大关系——函数关系和相关关系——均可以采用统计学方法对其中的信息进行分析,因而将统计分析的原理应用在数据挖掘中就是自然而然的事了。在实际运用中,统计分析方法和数据挖掘的其它技术方法可以融合在一起使用,互相补充。比较常用的统计分析方法有:因子分析、相关分析、判别分析、回归分析等。

2.3.3粗糙集方法

粗糙集最先是由波兰 Z. Pawlak 教授1982年提出的,它是一种研究不确定性

知识的数据分析处理理论[20]。粗糙集有着成熟的数学基础,不需要先验知识,并

且简单易用。在数据挖掘中,实际系统中的数据往往包含着许多噪声和缺失信息,传统的处理方法(如模糊集理论)大多需要先验知识或者附加信息,而粗糙集则可以克服这个缺点,粗糙集方法只需要利用数据内部的知识即可以从中发现隐含的知识和揭示潜在的规律,可以说是一种天然的数据挖掘方法。引入粗糙集理论,并且把它和传统的方法有机结合,可以大大增强对不确定和不完全信息的处理能力。

2.3.4 贝叶斯网络

贝叶斯网络是一个带有概率注释的有向无环图,是一种基于概率推理的图形

化网络[21]。贝叶斯网络的理论基础是贝叶斯公式,通过一些变量的信息的概率推理,贝叶斯网络可以高效地解决某些不确定性和不完整的问题。在数据挖掘中,可以把它应用到分类、聚类和预测等任务,并且对于海量数据的处理有着高准确率与高速度的优势。

2.3.5 人工神经网络

人工神经网络是一种仿生信息处理的数学模型,应用类似于大脑神经突触联

接的结构进行信息处理,是一种非线性自适应信息处理系统。最初的神经网络模型是由心理学家W. S. McCulloch和数理逻辑学家W. Pitts在1943年建立起来的,称为 MP 模型[22]。人工神经网络方法在近年来非常流行,由于其具有自学习功能、联想存储功能和高速寻找优化解的能力,因而非常适用于非线性数据和含噪声的数据的处理。引入人工神经网络方法挖掘现实系统中的大量复杂和非精确的数据显得十分有效。目前在数据挖掘领域中,最常用的人工神经网络方法是 BP 和RBF 网络。

2.3.6遗传算法

遗传算法也是一种仿生信息处理的数学模型,是一种通过模拟自然进化过程搜索最优解的方法,最初是由美国的 J. Holland 教授于 1975 年提出[23]。遗传算法的基本运算过程,类比生物进化过程,首先需要建立初始状态,也就是编码成染色体,并由染色体产生初始群体;然后评估适应度,即对每一个解(染色体)指定一个适应度的值;再进行繁殖,也就是染色体的选择(复制)、交叉(重组)和变异(突变)等操作;从而产生下一代,也就是新的染色体。上述过程迭代进行,优胜劣汰,适者生存,直到产生最佳方案为止。

3 消费者行为分析

消费者是企业的核心资源,促成了企业对消费者管理的需求,即客户关系管

理Customer Relationship Management,CRM)。CRM是一种新型管理机制,旨在提高企业的盈利,增大客户黏度,改善企业和客户之间的关系。CRM离不开消费者,对消费者的有效管理,需要对消费者行为进行分析进而对消费者行为进行预测,提升消费者满意度等。

3.1客户关系管理

客户关系管理(CRM)核心是将企业的客户作为重要的企业资源,通过完善

的客户服务和深入分析来满足客户的需要,从而使企业得以提供更快捷和周到的优质服务,提高客户满意度,吸引和保持更多的客户,进而增加营业额。

3.1.1 CRM目标

实现客户资源价值最大化是企业选择CRM的最终目标,本项目涉及到的移

动通讯客户庞大,对应的资源也是巨大的,对其行为进行分析,实现资源价值最大化将会带来意想不到的结果。CRM可以根据企业的自身情况分为:交叉销售、追加销售、客户保留、客户获取、客户再生和客户体验等多个方面。

就CRM目标而言,可以大致分为三类:

(1) 提高效率:由于信息技术的发展,CRM采用信息技术,提高了服务的自

动化程度,实现了信息的共享,能够较大地提升员工的工作水平,实现企业的搞笑运转;

(2) 拓展市场:通过对客户行为进行分析,结合当前的局势,能够较好的为

未来发展提供方向,在理论技术基础上,更好地把握市场机会,占领更多的份额;

(3) 增大黏度:对客户行为进行分析后,能够拓展消费者普遍喜欢的方式,

或者拓展个性化服务,增大客户黏度,提升客户满意度,帮助企业实现客户的稳定增长。

3.1.2 CRM的体系结构

CRM 系统根据其不同的需求侧重,CRM 可分为三种类型: (1) 操作型CRM; (2) 分析型CRM; (3) 协作型CRM;

运营型 CRM(Operational CRM)、分析型 CRM(Analytical CRM)、协作型 CRM(Collaborative CRM)几种类型。如果把 CRM 比作一个完整的人的话,运营型 CRM 是 CRM 的四肢,而分析型 CRM 则是 CRM 的大脑和心脏,而协作型 CRM 就是各个感觉器官[23]。我们可以得到 CRM 系统的主要过程是对营销、销售和客户服务三部分业务流程的信息化;与客户进行沟通所需要的各种渠道(如电话、传真、网络、亲自访问等)的集成和自动化处理:对上面两部分功能所积累下的信息进行的加工处理产生客户知识,为企业的战略战术的决策作支持。因此,我们可以把 CRM 看成一个两层结构的系统,其第一层系统为客户接触系统,它是 CRM 中企业与客户的接触点。第二层是负责客户关系计划,主要实现客户分析、活动管理及根据客户分析结果制定客户关系优化方案。下图是根据以上分析所得的客户关系管理基本系统结构图,运营型 CRM、分析型 CRM、协作性 CRM 是他们的一部分。

图 3.1 客户关系管理基本系统结构图

3.1.3移动通讯企业实施CRM的优势

据工信部统计数据显示,在2014年5月底,中国的手机用户已经达到12.56

亿,即相当于中国90%左右的人都在使用移动通讯,这是一个巨大的市场。与一般的行业相比,移动通讯的数据大,能够更加完善、深入地分析客户的行为,并且作为移动通讯企业,拥有先进的技术。综上,移动通讯企业教其它行业有客户信息和技术优势:

(1)客户信息优势

移动通讯企业最大的优势就是消费者数量庞大,拥有大量的客户信息,即拥有较全面的与企业经营有关的内部数据资料和外部数据资料。如果将这些数据进行分析,运用现在较深入研究的数据挖掘技术,深入分析隐藏在海量数据背后的价值,就能为企业管理决策提供有用的信息。我国较国外起步晚,消费者数量庞大,对此进行研究,能够为我国电信企业的科学化管理提供一条便利途径。 (2)技术优势

移动通讯行业一般属于国有企业,在信息化程度上较为注重,在CRM方面的资金、技术等投入在各行各业中属于领先地位。CRM属于现代信息化技术的一部分,在客观条件上,CRM覆盖面广、周期长、难度大,但是相对而言,在电信运营企业内部,有大量的系统分析与涉及人员、软件开发人员等,可以结合当前的需求,进行详尽的针对性分析。除此外,电信运营企业,有着优质的网络通信系统,能够实现实时关联,保持数据的及时更新,所以电信企业可以更加方便、实时、低价实现与客户信息的交流,为CRM分析提供良好基础。

3.2 CRM流程

CRM的目标就是对企业现有的业务和商业流程进行优化和重组,在客户关系

管理的过程中,面对客户的通常是市场部、销售部和客户服务部,上述部门对运营情况的反应,对上层决策起着至关重要的作用。对客户关系管理流程的完善,离不开以下几个部分:

图 3.2 客户关系管理完善流程

上述建立客户行为模式结算,基于企业对客户行为的分析理解,最终表现为客户知识,企业对客户知识的获取是通过对采集到的客户信息学习实现的,下图是客户知识的获取过程示意图[24]。

图 3.3 客户知识获取过程

由图3.3可见,客户知识的获取主要包括以下几个步骤:

(1) 接触客户:企业通过电话、传真、Web、E-Mail 等多种方式与客户进行接触。

(2) 建立关系:在接触的基础上,与客户建立“学习型”的互动关系。 (3) 信息采集:通过每一次接触、每一种渠道深入了解客户的点点滴滴,不断积累客户的个性化信息。

(4) 差异分析:不同客户之间的差异主要表现在两点:一是他们对企业的价值不同;二是他们对产品或服务的需求不同。对客户进行有效的差异分析,可以企业更好地配置资源,使产品或服务得到有效的改进,识别并掌握最有价值的客户以期获得最大的收益。

(5) 知识获取:通过对各个渠道的客户历史数据以及在线数据的分析处理,并进行数据挖掘,获取有关客户的知识。

(6)知识运用:将获得的客户知识运用到企业的客户服务、生产计划等各个部门,以便让这些知识发挥出杠杆作用。

3.3消费者行为分析

CRM的重要组成部分便是对消费者行为进行分析,进而建立客户行为模式,

为后续的管理与预测及活动管理的制定做准备。客户关系管理要求企业千方百计取悦自己的客户,让客户感到满意。并最终形成忠诚,这就要求企业能够充分了解自己的客户,当然也包括客户的消费行为。

3.3.1消费者行为

消费者行为是指消费者为获取、使用、处置消费物品或服务所采取的各种行动,包括获取前的决策过程[25]。当代企业研究消费者行为,不仅仅是了解消费者

是如何获取产品与服务的,更是了解消费者如何消费产品以及如何处置产品。如果企业想要与消费者之间建立黏性关系,就需要分析消费者的消费体验,消费者处理旧物的方式等,因为这些将会影响消费者的下次消费。只有建立完善的体系,深入分析消费者行为,才能在企业和消费者之间建立长远持久的关系。

随着服务业的发展,消费者行为研究受到了广泛关注,各大企业开始意识到,消费者行为不是购买或者获取这一阶段,消费者行为是一个整体,能够让企业更深入了解企业产品,以及更好的为消费者进行服务,取得更大的收益。在整个消费过程中,消费者行为常表现为如下几个阶段:

图 3.4 客户行为过程示意

在客户关系管理中,消费者行为分析可以分为两个方面[26]:

(1)整体行为分析:消费者行为整体分析从全局考虑,总括分析企业所有消

费者的行为规律,虽然整体行为分析有利于企业的总体规划和布局,但是由于客户组成的多元性,整体分析不能针对性地分析客户群体之间的差异,所以需要群体行为分析;

(2)群体行为分析:根据客户行为,可以将客户分为不同的群体,各个群体有着各自的特征,通过客户群体行为分析,消费者行为管理能够更好的发现群体规律,并采取针对性措施。

3.3.2 消费者行为模式

消费者行为模式是指消费者在某一时期内,相对稳定性、规律性和发展性的

消费者行为。当然,消费者行为常因为一些客观或主观的因素影响,但是消费者行为模式是相对稳定不变的,更有利于研究。消费者行为模式的研究客观反映消费者行为信息的分析,客观真实。

消费者行为模式有双重特征:

(1)稳定性:稳定性是指消费者在相对较短时间内较固定不变的消费行为模式。这种固定不变可能源于客户自身和外界环境的各种因素,如受收入水平等因素的制约客户在一定时期内表现出稳定的购买决策标准,对具体客户而言个人所表现出来的特定消费等均具有相对稳定性。

(2)发展性:发展性是指客户随时间发展受自身及外界环境因素的影响,其

消费行为也相应发生变化,表现为测度客户行为的特征指标发生变化。由营销管理的理论可知,客户行为模式发展性的影响因素是非常多的,但关键的问题是,如何掌握、认识客户行为模式的发展性。

3.3.3 消费者行为研究理论基础

由于消费者行为模式研究的基础是消费者行为具有规律性和发展性。不少学

者分别对消费行为的这两个属性进行研究并提出了一些基础理论,具有代表性的理论有消费者生命周期理论和反映层次模型(L-S模型),这些理论都可以作为研究消费者行为模式发展性的理论基础[27]。 (1)消费者生命周期理论

消费者生命周期理论也成为消费者关系生命周期理论,是指从企业与消费者建立业务关系到完全终止关系的过程,是客户关系水平随时间变化的发展轨迹,它描述了客户关系从一种状态向另一种状态运动的总体特征。客户生命周期可以分为考察期、形成期、稳定期和退化期四个阶段。考察期是客户关系的孕育期,形成期是客户关系的快速发展阶段,稳定期是客户关系的成熟期和理想阶段,退化期是客户关系水平发生逆转的阶段。 (2)反映层次模型

消费者在内在的需求与动机的作用下,对外部刺激产生一定的反应。按照Robert J.Lavidge 和 Gary A.Steiner(1961)提出的反应层次模型(L-S模型),他们认为客户对外界刺激的反应可能处在对产品和服务认识与情感的不同阶段并最终表现为购买消费,并且这些反应都以某种方式表现出来从而形成客户的反应信息,企业可以通过客户在不同阶段的反应尤其是购买行为的观察、记录等活动,收集其相关的客户信息,并通过对客户信息的研究分析对客户行为的规律性进行学习和认识,从而形成企业的客户知识指导企业的经营实践。反映层次模型最终反映了消费者在一个消费周期中消费行为的发展过程的发展规律。

图 3.5 反应层次模型

上述理论都可以作为消费者行为模型研究的理论基础,但是对每一个消费者

的行为模式的发展性而言,由于反映消费者行为模式的行为信息都是历史数据,因此对其发展性的研究可以依据预测理论从时间序列和类推两个角度出发。 (1)时间序列预测:

时间序列预测的基本思想是预测事物过去发展过程中形成的行为规律在将来依然保持基本不变,因此可以根据对历史数据的配合来认识客户行为模式规律,并通过外推预测未来某一时期内的消费者行为模式。但这一预测的基本假设前提是事物自身及外界相关环境因素没有发生根本性的变化,因而历史的模式规律能够继续保持下去而不发生改变。显然,依据消费者行为信息历史数据的时间序列分析消费者行为在短期内是可行的、合乎逻辑的;但从长期来看,消费者家庭生命周期阶段的改变意味着客户自身及外界相关环境因素的重大变化,消费者行为模式也必将产生相应的变化,而依据时间序列分析将难以得到合理的结论,即基于时间序列分析研究消费者行为模式的稳定性是可行的、但不适宜用于研究消费者行为模式的发展性。 (2)类推预测:

类推预测的基本思路是,如果一个事物在某种外界环境下其发展表现出某种规律性,那么类似的事物在同样的环境下也将表现出同样的规律性。这一方法也适用于对客户行为模式的预测。

至今为止,西方学者提出了不少消费者行为方面的模型,这些模型从不同视野和角度对影响消费者行为的变量及相互关系进行描述,从而有助于我们对消费者行为作更全面、系统的思考和把握。本文给出了消费者行为研究的一个简单框

架。如下图所示,该框架将影响消费者行为的各种因素按一定的层面组织在一起,形成消费者行为研究的一幅总体图画。从下午可以看出,该框架主要由三部分构成:

(1)决策过程:消费者在决策过程中,受到多种因素的影响,对消费商品的认识,收集商品的信息,与同类商品进行比较,并对其进行评价,最后决定是否购买,以及购买后的处置;

(2)个人因素:消费者消费行为与个人观念有着强有力的关联,其消费动机,对消费商品的需求,都对消费者的消费行为有着潜移默化的作用;

(3)外部因素:消费者消费与时代潮流,其所处的家庭、社会阶层有着间接的关系,最终影响其消费决策。

图 3.6 消费者行为研究框架

3.4消费者细分方法

消费者细分也可以称作客户细分,客户细分(Customer Segmentation)是 20

世纪 50 年代中期由美国学者温德尔·史密斯提出,是指按照一定的标准将企业的现有客户划分为不同的客户群的行为。正确的客户细分能够有效的降低成本,同时获得更强、更有利可图的市场渗透[28]。

按照群体分析方法,属于一个细分群体的消费者消费行为类似,相对而言,属于不同细分群体的消费者其消费行为则大不相同。当然分类的标准也大不相同,有的是在区域上相似,同属学校、工厂等;有的是收入相似有的则是其消费

偏好相似。对于移动通讯而言,其消费偏好有的偏好流量多,有的偏好话费多,理解不同消费者群体的偏好、购物态度、价格观念是市场营销成功的关键,明智的商家和营销人员会根据不同城市的不同消费群体,以及不同的产品生命周期的阶段,有效地规划市场策略。本文主要从消费者消费行为的角度出发,目前基于消费者消费行为研究方法与消费者价值相结合,RFM是目前使用最多的一种消费者消费行为研究方法,而消费者价值矩阵可以对RFM模型进行改进。

3.4.1 RFM分析

RFM分析是广泛应用于数据库营销的一种客户细分方法。其中R、F、M各

有其含义:R(Recency)指上次购买至今的时间间隔,该时期越短,则 R 越大。研究发现,R 越大的客户越有可能产生新的消费行为[29],R 越大,企业保存该客户的数据就越准确,R 越小则该客户的数据有效性越低,如果时间间隔一年,则有 50%的客户信息失效。F(Frequency)指在某一期间购买的次数。交易次数越多的客户越有可能与产生新的新的消费行为[30]。M(Monetary)指在某一期间内消费的额度,M 越大,越有可能产生新的消费行为[31]。

用来衡量该客户的行为,RFM 分析的所有成分都是行为方面的,这些容易获得的因素,能够预测客户的购买行为,以最近的行为预测客户的购买行为比用其他任何一种因素进行预测更加准确有效[32]。RFM三个指标可以用下图进行描述:

图 3.7 RFM指标参数

从上图,本文将客户价值分为八类:即一般价值客户、一般发展客户、一般挽留客户、一般保持客户、重要价值客户、重要发展客户、重要挽留客户和重要保持客户。 本文对RFM进行了五等分切割,以100、10和1加权得到了125个RFM魔方块,将数据导入到IBM Modeler中,使数据满足RFM的数据结构要求,

建模如下:

图 3.8 SPSS Modeler进行RFM分析模型

本文将消费者数据记录导入进去,包含了消费者在2014年度消费的日期和

金额,通过RFM分析,统计出2014年消费者消费的频率、最近一次消费的时间以及总消费金额,以5分制,计算出对应的R、F、M,进而得到RFM=R*100+F*10+M。将所得的数据导入到Tableau中进行可视化分析,有:

图 3.9 RFM导入Tableau进行可视化分析

将数据导入到IBM SPSS中进行描述性分析,得到RFM块计数:

图 3.10 SPSS中RFM描述性分析

块计数图表显示选定离散化方法的块分布。 每个条代表将被分配每个合并 RFM 得分的客户数。 尽管您通常希望相当均匀的分布,即所有(或多数)条大体高度相同,但当使用将同数值分配给相同块的默认离散化方法时,必然会产生一定量的偏差。 块分布中的极值波动和/或较多空的块可能表明您应尝试另一种离散化方法(块数量和/或随机分配数量较少),或重新考虑 RFM 分析的适用性。

块计数表显示选定离散化方法的块分布。 每个单元格代表将被分配每个合并 RFM 得分的客户数。 尽管您通常希望相当均匀的分布,即所有(或多数)单元格包含类似数目的客户,但当使用将同数值分配给相同块的默认离散化方法时,必然会产生一定量的偏差。 单元格计数中的极值波动和/或较多零计数的单元格可能表明您应尝试另一种离散化方法(块数量和/或随机分配数量较少),或重新考虑 RFM 分析的适用性。

图 3.11 RFM热图

RFM热图由时间先后顺序和频率得分定义的类别的平均货币值。 颜色越深的区域表示平均货币值越高。 换句话说,时间先后顺序和频率得分在深色区域中的客户,比时间先后顺序和频率得分在浅色区域中的客户的平均花费货币值大。利用Tableau进行可视化操作有:

3.4.2 客户价值矩阵分析

由于RFM分析的缺点:

(1) 分析过程复杂,需要耗费很多时间;

(2) 细分后得到的客广群过多,如每一种变量用三个值就会得到27个客户

群,以至于难以形成对每个客户群的准确理解,也就难以针对每个细分客户群制定有效的营销策略。

(3) 由于结果只使用 R×F×M 的值进行区分,不容易细分每个因素的对结

果的贡献,例如在一个 5×5×5 的测量空间里,难以区分 1×2×5 和 5×2×1 这两个客户的行为差别。

(4) 购买次数(F)与同期总购买额(M)这两个变量存在多重共线性,即一

个给定客户每多一次购买,他的总购买额也相应增加[20]。

为了消除消费次数与总消费额的多重共线性, Marcus 提出对传统的 RFM分析进行修正,用平均消费额代替总消费额[33],另外,为了解决传统 RFM 分析过多细分客户群的缺陷,他提出用购买次数(F)与平均购买额(A)构造的客户价值矩阵简化细分的结果,如下图。第三个变量 Recency 在客户价值矩阵中被剔除,Recency 与其他的变量(如交易类型、关系的长度与客户价值矩阵)结合使用。

图 3.12 客户价值矩阵分析

产生客户价值矩阵需要的信息有:客户代码、购买日期。当日购买额,购买次数由不同的购买日期的数目确定,当日购买额用来计算平均购买额。Recency

可以由最近的购买日期确定,关系的长度可以用最近的购买日期减最早的购买日期。交易类型需要收集产品信息。地理、人口统计学、偏好方面的信息也可以与客户价值矩阵结合使用。

图 3.13 Marcus客户价值矩阵流程

在 Marcus 提出的客户价值矩阵中,确定购买次数与平均购买额的基准是各自的平均值,一旦确定每一个坐标轴的平均值,每个客户就被定位于客户价值矩阵的某个象限里。然后,分析每个象限中的客户群的关键差异,并根据各个矩阵的差异采取不同的营销策略。客户价值矩阵的优点在于这种细分方法简化了客户细分群体,而且易于产生针对每一个客户群的与跨越客户群的营销战略/战术,下图为基于客户矩阵的营销策略。最好的客户代表了企业的基础,应采取保持策略;对于乐于消费型,最适当的战略是增加他们的购买频率;对于经常性客户,他们通过不断的购买证明了自己的忠诚,最好的战略是通过交叉销售。向上销售增加他们的平均购买额;对于不确定型客户,应对他们进行进一步的细分,把营销努力集中于不确定型的新客户和那些对某种具体的产品感兴趣的客户。结合其它的客户信息,客户价值矩阵能够制定跨越客户群的营销战略/战术,强化客户保持[20]。

3.5 移动通讯企业的消费者细分问题

不论是国外移动通讯企业还是国内移动通讯公司,都习惯将移动通讯客户分

为三大类,即大客户、商业客户和公众客户[33]。一般情况而言,移动通讯企业的消费者细分主有两种方式:

(1)按照客户消费额度进行细分;

(2)依据客户年龄、职业等指标进行细分;

虽然移动通讯企业的消费者细分标准可能不同,但是由于移动通讯经营业务有一定相似性,客户群体一样,以中国电信、中国移动、中国联通和中国网通为

例,中国电信和中国网通在网络上有类似性,中国移动、中国联通和中国电信在移动客户端上有一定类似性。

对上述消费者细分方式,下表是移动通讯企业消费者细分所采用的方法及存在问题,从该表可见,无论是以消费额还是其他指标的综合度量,这些方法都存在局限性。

由统计数据,移动通讯客户端有近13亿人口,面对这庞大的人口,需要展开差异化营销,否则一视同仁、无差异化营销

电信客户数量极其庞大,要开展差异化营销,如果没有一套行之有效的细分标准和模式是很难想象的。大客户可用其消费额或行业等进行区分,而商业客户和大众客户却很难区分,不利于开展差异化营销,主要表现如下: (1) 商业客户尚没有成熟的细分经验可以借鉴

不论是大客户还是公众客户,目前都有较成熟的细分经验可以借鉴,而商业客户没有。在大客户市场,行业是一个已经证明了的非常有效的细分维度[34],许多电信企业都用行业来细分大客户群,如将大客户分为金融证券保险业客户、制造业客户、党政军客户、旅游酒店业客户、教育类客户,等等,这些客户群的电信消费需求和消费行为确实存在巨大差异。

首先,商业客户相对比较零散,如果依据行业进行客户细分,这些细分群并不表现出明显的差异,而且国内国外也没有其他的分类方式可以为商业客户所借鉴[35]。其次,公众客户主要表现为个人或家庭消费,虽然目前存在一些针对个人或家庭的细分,但对商业客户细分模型的研究几乎没有,而个人或家庭的经验很难移植到商业客户中。

(2) 商业客户具有单位和个人消费的双重特征

商业客户都是些规模较小的单位,其中包括为数众多的个体工商户,他们的通信消费往往公私结合,既有公务消费特性也有个人消费特性。例如,商业客户长途消费多,但并不是异地业务往来的结果,而可能是打私人长途电话的结果[36]。正因为商业客户具有单位和个人双重消费的特征,在细分时,如果一味地采用单位细分维度或个人细分维度,往往得不到有效的结果,但如果将两者结合起来细分,难度明显加大,目前还没有这方面成功的经验。

3.6 本章小结

本章对消费者行为进行了定性分析,并运用RFM方法,将消费者在2014年内的消费时间和消费金额转化为R、F、M这三个定量指标。并对当前移动通讯企业的消费者细分现状进行了简要的叙述,为之后的研究奠定基础。

4 移动通讯消费者细分案例

相对欧美国家,中国IT技术起步较晚,在1999年CRM才逐步应用到IT、银

行、物流等行业。由于中国人口数量多,CRM在中国有着广泛的应用前景,并且伴随着电子商务时代的来领,CRM正引起了各大行业的重视。作为移动通讯行业L电信公司,有着近35万移动通讯客户端,对CRM有着强烈的需求。

4.1数据预处理

本文对中国某省电信运营商的24785数据(条记录)作为样本数据,由于样

本数据极易受到噪声污染,导致数据丢失或者数据与真实数据不一致,这些噪声数据将导致低质量的数据挖掘效果,数据预处理技术将会提高数据质量,从而提高数据挖掘结果的质量。一般而言,数据预处理的方法主要有三种:

(1)数据清理:对于大型数据库而言,要分析的某一维的某个属性中数据有遗漏是再正常不过的事情了,对于这种情况,有如下处理办法;忽略人工填写或使用一个全局常量填充遗漏值、使用属性的平均值填充遗漏值、使用与给定元组属同一类的所有样本的平均值、使用最可能的值填充遗漏值。在此最常用的也是最合理个人认为是最后一种方法,可能值可以通过回归分析、贝叶斯形式方法或判定树等得出。噪音数据:正如自然界有很多噪音一样,数据也会参杂很多杂质,除噪音的技术有分箱、聚类、计算机人工检查和回归。分箱技术只要是把数据分类然后用合理的数值替换原先数据,致使出去原数据中的噪音;聚类技术是通过“距离”等判别把数据进行概念分层,过渡到更高一级的层次;回归技术则是利用回归模型,用模型预测值代替原有数据。

(2)数据集成与变换:数据集成顾名思义是把多个原数据中的数据结合、存放到一个数据存储。如数据仓库。其中要考虑三个问题:实体识别、数据冗余和数据值冲突检测与处理。数据变换是数据处理的必然结果,主要有平滑、聚集、数据泛化、规范化以及属性构造。其中平滑可以用分箱、聚类和回归来实现。数据泛化过程即概念分层,将低层次的数据提炼到更高一级的概念层次中。规范化又有最大最小规范化、0-值规范化和小数定标规范化。此外还可以构造新的属性来使数据集成。

(3)数据归约:当你面临大型数据库中的海量数据时,要分析这些数据是个很庞大的工程,如果对所有数据进行分析和挖掘,将要耗费很长的时间。如果我们能把握主要数据,那么分析起来将快捷很多。此类技术主要有如下几类:数据方聚集、维规约(检测并删除不相关、弱相关或冗余的属性或维)、数据压缩(小

波或傅立叶变换以及主成份分析)、数值规约(用替代的、较小的数据表示替换或估计数据):主要有回归、直方图、聚类、选样等操作;还有概念分层。

三种方法各有优点,针对本文需求,样本数据只有24785条,数据量并不是很大,所以可以采用数据清理对其进行操作,对RFM进行频段排序有:

图 4.1 RFM中R指标频段排序

从上图看可以看出,R(recently)即最近购买移动产品消费者的分布较为均匀,在大量样本下具有一定统计意义,该指标可以认为没有噪声。

图 4.2 RFM中F指标频段排序

对购买频率F进行统计,也可以看出和R呈现一定正相关,分布也较为均匀,没有特别的噪声点等。

图 4.3 RFM中M指标频段排序

从上图对消费金额的数据得到,高金额消费者较少,但是其总价值较高,本

文对部分离散点进行剔除,最终得到了24690个有效样本数据,用于接下来的数据分析。

4.2消费者聚类

第三章已经得到了消费者的RFM值,对客户进行细分,从而分类分析其消费

行为,进而能够挖掘其可能的发展趋势。常用的聚类算法有K-means、两步法和基于神经网络的Kohonen聚类方法[37]等,本文对上述三种聚类方法进行建模:

图 4.3 消费者SPSS Modeler聚类模型

通过SPSS Modeler对三种细分方法进行处理,并且根据本文需求,将本文消费者细分成五类:

表 4.1 消费者细分类别属性

消费者类别 属性 重要保持客户即对企业的营销有着重要影响,并对整个企业重要保持客户 的收入贡献巨大的消费者属于此类,该类消费者大多消费频率较高,消费时间较近,消费金额较大等特点。 重要发展客户即存在巨大潜力的客户,这类型客户可能现阶重要发展客户 段的消费水平属于中等层次,但是随着时间的发展,其消费可能会有较大提升,该类消费者可能消费频率较高,消费时间较近,但是消费金额相对较少。 重要挽留客户即之前属于有价值客户,在企业发展中贡献了重要挽留客户 一定力量的客户,但是随即技术的进步或者一些外在原因,导致其在其他同类型企业进行消费。该类客户可能最近消费频率较低,消费时间较远,消费金额较高。 一般价值客户指对企业发展贡献不大的客户,其相对低价值客户而言,在R、F、M指标上可能略高一些。 一般价值客户 低价值客户 低价值客户指对企业发展相对作用较小的客户,在R、F、M综合指标上应该最低。 由上表可知,重要保持客户、重要发展客户、重要挽留客户是企业有价值客户的主要组成部分,挖掘高价值客户的消费规律,能够更好地增大消费者和企业之间的黏性,但是对于一般客户、低价值客户等也要予以关注,将这些相对低价值客户转化为有价值客户,进而向高价值客户转移[38]。以上就需要企业对不同价值客户群体之间的消费规律和消费习惯予以关注,从大量数据中提取出对应客户类别的有价值信息,将挖掘出来的消费者的消费规律和消费习惯转化为行之有效的营销策略,进行精准营销,为客户提供横好、更便捷的高效服务,为企业的发展创造更高的价值。

4.2.1 K-means聚类

k-means聚类算法是聚类算法中较为简单的一种聚类算法,基于n个样本数

据之间的距离进行迭代计算,将n个样本数据分类成k类,k为设定值,使每个样本数据距离其所在的聚类中心距离最小。较常用的距离计算方法有两种,欧氏距离和曼哈顿距离,本文采用欧氏距离进行聚类。

本文将消费者分为五类,即重要保持客户、重要发展客户、重要挽留客户、一般客户和无价值客户,虽然细分有利于数据挖据的精确性和数据挖掘结果的可靠性,但是,分类越多数据处理越麻烦,但是细分类别较少时,结果就不精确,多以本文将消费者分为五类,较好区分客户之间的属性,并且又较有效降低计算复杂度。

图 4.4 K-Means聚类结果

由第三章RFM计算得到各个客户的R、F、M指标后,由于各个指标的权重

不同,客户价值细分相对重要的为客户的消费金额,K-Means将所有样本划分成五类,即重要保持客户、重要挽留客户、重要发展客户、一般价值客户、低价值客户,五类客户在R、F、M指标值上各不相同:

表4.2 K-Means聚类结果和各指标均值 聚类 比例 聚类-1 MW_Score 8.37 FW_Score 4.65 RW_Score 2.85 聚类-2 MW_Score 1.25 FW_Score 8.50 RW_Score 7. 聚类-3 MW_Score 23.50 FW_Score 14.21 RW_Score 8.21 聚类-4 MW_Score 20.29 FW_Score 11.21 RW_Score 3.46 聚类-5 MW_Score 7.62 FW_Score 4.50 RW_Score 7.88 均值

表 4.3 K-Means聚类客户价值分类

聚类结果 中位数分布图 参数 FW 中位数 3 10 2 15 25 8 12 20 4 3 10 8 9 15 8 客户价值 聚类-1 MW RW FW 低价值客户 聚类-2 MW RW FW 重要保持客户 聚类-3 MW RW FW 重要挽留客户 聚类-4 MW RW FW 一般价值客户 聚类-5 MW RW 重要发展客户 由上表可得,所谓重要保持客户即在消费金额、频率上较高,并且最近消费时间较近,综合而言,聚类-2在RW、FW、MW上数值较高,所以定义为重要保持客户;重要发展客户即其消费还有巨大的潜力,并且是该企业的较忠实客户,即在FW和RW上相对较高,但是消费金额评价指标MW相对较低,聚类-5满足其指标,定义为重要发展客户;重要挽留客户即其近期消费时间较远,但是其消费金额较高,所以将聚类-3定义为重要挽留客户;聚类-1和聚类-4还没有定义,相比较而言,聚类-4综合指标高于聚类-1,所以将聚类-4定义为一般价值客户,聚类-1定义为低价值客户[39]。上述客户细分在客户价值上,大致可以提供营销分一个依据,根据不同的客户类型,在不同方面着重进行针对性营销。

4.2.2 Two-Step聚类

两步法是一种分层算法,目前多用于采矿、电子商务与多元统计的交叉领域。

该算法能够处理大量数据,可以自动确定类的数目,并且能够处理连续变量和分类变量的混合数据,因为Two-Step算法即两步算法是分前后两步进行,其得名便来源于此。两步算法分两步[40]:

(1)准群集过程:第一步使用BIRCH算法,将样本数据集划分成许多子类。BIRCH算法是实际上是把层次群算法与其他算法结合的多阶段群集。

(2)具体群集分析:对似然函数做距离曾连那个公式,利用BIRCH算法划分的子类,对一定范围的每个类成员计算其AIC值,来估计类的最初数目。

本文对样本数据进行两步分类,得到:

图 4.5 Two-Step聚类结果

由第三章RFM计算得到各个客户的R、F、M指标后,由于各个指标的权重不同,客户价值细分相对重要的为客户的消费金额,K-Means将所有样本划分成五类,即重要保持客户、重要挽留客户、重要发展客户、一般价值客户、低价值客户,五类客户在R、F、M指标值上各不相同:

表 4.4 Two-Step聚类结果和各指标均值 聚类 比例 聚类-1 MW_Score 7.24 FW_Score 4.19 RW_Score 3.58 聚类-2 MW_Score 16.32 FW_Score 8.31 RW_Score 3.54 聚类-3 MW_Score 10.83 FW_Score 6.12 RW_Score 8.62 聚类-4 MW_Score 23.42 FW_Score 14.18 RW_Score 4.45 聚类-5 MW_Score 21.90 FW_Score 12.44 RW_Score 8.48 均值

表 4.5 Two-Step聚类客户价值分类

聚类结果 中位数分布图 参数 FW 中位数 3 5 4 9 20 4 9 15 8 6 10 8 15 25 8 客户价值 聚类-1 MW RW FW 低价值客户 聚类-2 MW RW FW 重要挽留客户 聚类-3 MW RW FW 重要发展客户 聚类-4 MW RW FW 一般价值客户 聚类-5 MW RW 重要保持客户 由上表可得,所谓重要保持客户即在消费金额、频率上较高,并且最近消费时间较近,综合而言,聚类-5在RW、FW、MW上数值较高,所以定义为重要保持客户;重要发展客户即其消费还有巨大的潜力,并且是该企业的较忠实客户,即在FW和RW上相对较高,但是消费金额评价指标MW相对较低,聚类-3满足其指标,定义为重要发展客户;重要挽留客户即其近期消费时间较远,但是其消

费金额较高,所以将聚类-2定义为重要挽留客户;聚类-1和聚类-4还没有定义,相比较而言,聚类-4综合指标高于聚类-1,所以将聚类-4定义为一般价值客户,聚类-1定义为低价值客户[41]。上述客户细分在客户价值上,大致可以提供营销分一个依据,根据不同的客户类型,在不同方面着重进行针对性营销。

4.2.3 Kohonen聚类

Kohonen网络是自组织竞争型神经网络的一种,该网络为无监督学习网络,能够识别环境特征并自动聚类。Kohonen神经网络是芬兰赫尔辛基大学教授Teuvo Kohonen提出的,该网络通过自组织特征映射调整网络权值,使神经网络收敛于一种表示形态,在这一形态中一个神经元只对某种输入模式特别匹配或特别敏感。Kohonen网络的学习是无监督的自组织学习过程,神经元通过无监督竞争学习使不同的神经元对不同的输入模式敏感,从而特定的神经元在模式识别中可以充当某一输入模式的检测器。网络训练后神经元被划分为不同区域,各区域对输入模型具有不同的响应特征。

Kohonen神经网络算法工作机理为:网络学习过程中,当样本输入网络时,竞争层上的神经元计算输入样本与竞争层神经元权值之间的欧几里德距离,距离最小的神经元为获胜神经元。调整获胜神经元和相邻神经元权值,使获得神经元及周边权值靠近该输入样本。通过反复训练,最终各神经元的连接权值具有一定的分布,该分布把数据之间的相似性组织到代表各类的神经元上,使同类神经元具有相近的权系数,不同类的神经元权系数差别明显[42]。需要注意的是,在学习的过程中,权值修改学习速率和神经元领域均在不断较少,从而使同类神经元逐渐集中。

图 4.6 Kohonen聚类结果

4.2.4聚类结果比较

本文根据需求,将消费者细分成五类,导入到原始数据表中,进行聚类结果

的分析和比较,通过SPSS Modeler进行建模:

图 4.7 SPSS Modeler建模

曲线导出如下:

图 4.8 导出模型分析曲线

最终将分类结果导入到原始数据表中有:

图 4.9 最终消费者细分结果

并以K-Means分类结果为准,通过EXCEL将原始数据中重要保持客户、重要发展客户、重要挽留客户、有价值客户和低价值客户进行分类提取,得到细分客户的工作表,便于SPSS的分析。

4.3细分客户消费行为分析

由第四章将消费者进行细分成五类后,分别对其消费行为进行分析和处理,

由于进行业务统计,只能得到其性别和年龄,对其收入、学历等私人信息不能进行统计,所以本文只能对其性别和年龄分段通过Tableau进行统计,得到在不同细分客户群体中其消费规律,进而进行详细分析和处理。

4.3.1重要保持客户

在重要保持客户中,套餐2、3、4的使用量最多,并且男性较女性多一些,

但是相对保持均匀分布。就上述结果而言,在进行营销时,为了对该类客户进行更深入地挖掘,可以将套餐2、3、4的促销进行通知,并且在业务更新上进行更加详尽的处理,可以开发和2、3、4类套餐类似的业务。

图 4.10重要保持客户不同消费套餐男女比例

在整个年龄阶段而言,分布较为均匀,其中幼年、高龄相对较少,可见,在

高价值保持客户中,年龄分段相对重要性并不是那么高。

图 4.11 重要保持客户不同年龄消费套餐频率图

4.3.2重要发展客户

图 4.11重要发展客户不同消费套餐男女比例

在重要发展客户这一分类中,套餐2最受欢迎,并且该类客户在套餐6、7

上消费相对较少,对该类客户可以在套餐2上的相关促销予以通知,并且拓展相关业务。

图 4.12重要发展客户不同年龄消费套餐频率图

在重要发展客户中,青年和中老年占比相对较大,青年刚步入社会,对整个

市场消费产品的分类并不是很清楚,所以进行相关的促销有利于本企业的市场份额的增加,并且在中老年这一阶段,其对新技术的敏感度相对较低,但是其在整个社会家庭中的地位相对较高,并且其拥有较大的消费能力,是值得挖掘和发展的一类消费群体。

4.3.3重要挽留客户

图 4.12重要挽留客户不同消费套餐男女比例

在重要挽留客户中,男女比例较为均衡,没有很明显的性别特征,其中使用

套餐2的消费者最多,套餐7消费最低。

图 4.14重要挽留客户不同年龄消费套餐频率图

在重要挽留客户中,中老年的比例最高,还有中青年,由于中老年客户群体

的消费观念和当代的消费前沿群体有着很大的区别,在进行套餐的选择、企业的选择上可能都会呈现一定的多次比较,并且由于中老年群体的业务和人际交往并不频繁,所以在通话、流量等需求并不高,可以针对老年人的消费需求和习惯,进行相关业务的开展[43]。并且由于年轻人的工作需求,在外地工作、整个公司内部小号等,可能会流失,针对其特性,可以在全球通业务上进行一定的拓展。

4.3.4一般价值客户

图 4.15一般价值客户不同消费套餐男女比例

在一般价值客户中,性别的区分并不是分明显,但是套餐的分布上较为均匀,

套餐1、7比较少,套餐2相对较少,其他较为均匀分布。

图 4.16一般价值客户不同年龄消费套餐频率图

在一般价值客户中,年龄分布较为均匀,青年和老年人相对较少,由于统计

数据的样本在整体年龄分布上也呈现这一走势,综上而言,一般价值客户的年龄分布没有特别明显的特征。

4.3.5低价值客户

图 4.17低价值客户不同消费套餐男女比例

在低价值客户中,其在套餐4、5、6上消费最多,套餐1上消费较少,这类

客户相对其他客户,在套餐7上消费相对较多。由于统计样本较多,性别仍然呈现均匀分布,并没有明显的区别。

图 4.18低价值客户不同年龄消费套餐频率图

在低价值客户中,老年人相对较多,由于其在新业务上的需求并不高,所以

导致其消费可能相对较少。较重要挽留客户等相对而言,不同细分客户中可能存在一定的重叠性,但是在大数据上而言,仍然可以有一定的区分性。

4.4 实证研究

4.4.1对某省电信运营商客户的细分

本文选取了中国某省电信运营商的BOSS数据库和经营分析系统中的部分 数据作为样本数据集,来验证本文提出的客户购买行为模式分析模型中不同价值 客户的细分。所使用的样本数据共52984条记录。 根据上述聚类分析的结果,将客户分为3类,见下表。

表 客户分类结果 客户群组号 客户群1 客户群2 客户群3 客户数 8718 25783 18485 百分比 16.5% 48.7% 34.8% 月通信费(元) 170.11 45.17 41.09 短信条数 37 14 13 从上表聚类结果中可知,电信运营商的有三类有价值的个人客户,根据个人客户通信费的不同,可以将个人客户划分成为高价值客户、一般价值客户和低价值客户。根据表4-1可知,客户群1的平均通信费为170.11元,则客户群1也被称作高价值客户群;客户群2的平均通信费为45.17元,则客户群2被称作为一般价值客户群;客户群3的平均通信费为41.09元,则客户群3被称作为低价值客户群。由表4-1可知,在这些客户中高价值客户占全部客户的16.5%,而一般价值客户群和低价值客户群则占全部客户的83.5%,因此,本次分类结果基本服从“二八定律”。

聚类后各类中类别变量的统计表,如表4-2所示。

Cluster 高价值客户 高价值客户 高价值客户 高价值客户 高价值客户 一般价值客户 一般价值客户 一般价值客户 一般价值客户 一般价值客户 低价值客户 Variable 手机报 手机支付 手机证券 彩信 来电提醒 手机报 手机支付 手机证券 彩信 来电提醒 手机报 Value1 0(90.81%) 0(99.59%) 0(90.87%) 0(56.58%) 0(95.62%) 0(.83%) 0(93.57%) 0(96.78%) 0(61.06%) 0(96.16%) 0(97.01%) Value2 1(9.19%) 1(0.41%) 1(7.13%) 1(43.42%) 1(4.38%) 1(10.88%) 1(6.43%) 1(3.22%) 1(38.94%) 1(3.84%) 1(2.90%)

低价值客户 低价值客户 低价值客户 低价值客户 性别1代表男性。)

手机支付 手机证券 彩信 来电提醒 0(98.85%) 0(99.77%) 0(99.90%) 0(99.58%) 1(1.15%) 1(0.23%) 1(0.10%) 1(0.42%) (注:客户类型中1代表全球通用户,2代表动感地带用户,性别0代表女性,

4.4.2 细分结果分析

本实例聚类的结果是将数据库中客户细分为3个群组。下表对3个群组的客户群体特征进行简要总结。 群组 高价值客户 比例 16.5% 主要特征 对数据业务服务具有相对较高的需求,有8288人,占此客户群中客户总数的95.07%。在这类客户群中,男性用户有6227人,女性用户有2491人,男性用户约为女性用户的2.5倍。在高端用户中,数据业务费用要远远低于语音业务费用,但是数据业务费用的总额要远远高于其他的两个客户群,平均数据业务费约为42元,大约是有价值客户的2倍。此客户群中的 用户更偏爱使用手机邮箱、彩信等业务。 对数据业务服务具有一定的需求,有18463人,占此客户群中客户总数的71.6%。在这类客户群中,男女比例基本持平。

一般价值客户 48.7% 在中端用户中,数据业务费用和语音业务费用基本持平,略低于语音业务费用。此客户群中的用户更偏爱使用手机报、彩信和手机报业务。 低价值客户 34.8% 各项服务使用率低,有18483人。在这类客户群中,男性用户有11305人,女性用户有7178人,男性用户约为女性用户的1.6倍。在低端用户中,数据业务费用和语音业务费用都比较低,在消费的总费用中语音业务费用占据95%以上,而数据业务费用不满5元。此客 户群中的用户更偏爱使用彩信、和手机报业务。 4.4.3 研究结果的现实意义

最后对数据进行检测,将原始数据分为训练集和测试集,分别占60%和40%,对聚类结果进行检验,对K-Means、Kohonen、Two-Step进行分析。本章的实证研究采用了对某运营商经营分析数据库和业务平台数据库中的部分数据记录,见证了运用数据挖掘软件可以发现移动新客户购买数据业务组合方面的一些规律性信息。只要涉及到适当的数据有关联规则挖掘技术。就可以获得移动通信客户在一定时间内的消费需求与偏好,消费结构等信息,在充分简介移动通信客户在一定时期内消费需求与偏好的前提下,电信运营商运用这些规律实施规律精确营销,不但可以大大的提高营销成功率从而降低营销成本,而且能够增加客户的粘性降低流失率。

5 移动通讯消费者相关性

移动通讯企业大部分的目的都是通过迎合消费者的需求,并开展相关促销过

活动刺激消费者的消费欲望,来提高企业的营销效率。要精确找到有价值客户的消费心理和消费习惯,就需要对以往已知数据进行处理,进而进行分析和处理,从而制定行之有效的营销策略,完成在正确的时间和地点将产品或者服务提供给正确的人,从而提高移动通讯运营商的营销效率,对移动通讯消费者购买倾向进行预测能够较好完成对消费者消费心理和消费习惯的把握。

5.1消费者购买相关性

本文通过上述RFM等方法对消费者进行细分,通过K-Means将消费者分为

五类,在每一个细分消费者群体中预测其某种消费的可能性,进而挖掘出各类的消费模式,从而向符合某种条件的消费者推荐相应的产品,实现企业利润的增长和消费者之间的黏度的增加。本文将不同消费者群体的购买倾向的相关关系用“IF/THEN”的形式进行表示。常用的决策树有CART、CHAID树和C5.0树,通过样本数据建立消费者消费倾向的分类模型来预测消费者的未来消费倾向。

本文有24690条有效消费记录(可能重复含有消费者),消费者数量为8390,通过细分,用SPSS Modeler进行建模,并将各类的数据分成训练集和测试集两部分:

表 5.1 消费者细分后数据比例

消费者类型 重要保持客户 重要挽留客户 重要发展客户 一般价值客户 低价值客户 比例 30.3% 34.5% 12.7% 18.8% 3.7% 统计变量 数量 比例 数量 比例 数量 比例 数量 比例 数量 比例 训练集 1020 40% 11 40% 411 40% 299 40% 126 40% 验证集 766 30% 873 30% 308 30% 224 30% 93 30% 测试集 766 30% 873 30% 308 30% 224 30% 93 30% 5.1.1CART算法原理

分类回归树算法(CART,Classification And Regression Tree)算法采用一种二

分递归分割的技术,将当前的样本集分为两个子样本集,使得生成的每个非叶子节点都有两个分支。因此,CART算法生成的决策树是结构简洁的二叉树。分类树两个基本思想,即建树和剪枝。 建树

第一步是将训练样本进行递归地划分自变量空间进行建树,设表示第个样本的个属性,本文中即其消费日期、性别、年龄、收入、市话消费金额、4G/3G/2G流量使用情况等一系列指标,其中CART算法就是通过递归的方式将维的空间划分为不重叠的矩形,其步骤如下:

(1)选一个自变量,再选取的一个值,把维空间划分为两部分,一部分的所有点都满足,另一部分的所有点都满足,对非连续变量来说属性值的取值只有两个,即等于该值或不等于该值。

(2)递归处理,将上面得到的两部分按步骤(1)重新选取一个属性继续划分,直到把整个维空间都划分完。

在划分时,对于一个变量属性而言,其划分点是一对连续变量属性值的中点,假设m个样本的集合一个属性有m个连续的值,则会有m-1个点,每个点为相邻两个连续值的平均值。每个属性的划分按照能减少的杂质的量来进行排序,而杂质的减少量定义为划分前的杂质减少去划分后的每个节点的杂质量划分所占比率之和,而杂质度量方法常用GINI指标,假设一个样本共有C类,则一个节点A的Gini不纯度可以定义为:

其中表示属于i类的概率,当Gini(A)=0时,所有样本属于同类,所有类在节点中以等概率出现时,Gini(A)最大化,即。所以只要找到杂志变量最大的一个划分,那么就找到了该属性划分的最优分支。 剪枝

第二步是用验证数据进行剪枝,当分类回归树划分的太细时,会对噪声数据产生过拟合的作用,所以需要进行剪枝。剪枝又分为前剪枝和后剪枝:前剪枝是指在构造树的过程中就知道那些节点可以减掉,进而不对该类节点进行分类;后剪枝则是指在构造出完整的决策树之后再来考察那些子树可以剪掉。

5.1.2CHAID算法原理

CHAID算法的前身是AID,主要特征是多项分叉、前向修剪,即所谓的卡方

检测,并且CHAID只能处理类别型的输入变量,因此连续型的输入变量首先就需要进行离散处理。形式上,CHAID相对直观,并且因为CHAID是以因变量为根节点,对每个自变量的分类均为显著性分类,通过比较分类的显著性程度,最后选择最显著的分类法作为子节点,最后得到的每个叶节点就是一个细分市场。

5.1.3 C5.0算法原理

ID3算法是J. Ross Quinlan在1975提出的分类预测算法,C5.0是基于ID3

发展起来,在ID3基础上增加了队连续性的离散化,并在执行效率和内存使用方面进行了相应的改进。。该算法的核心是信息熵, 信息熵就是一组数据包含的信息,概率的度量。一组数据越有序信息熵也就越低,极端时如果一组数据中只

有一个非0,其它都是0,那么改组数据的信息熵等于0,因为只有可能是这个非0的情况发生,它给人们的信息已经确定了,也可以说不含有任何信息了,因为信息熵含量为0。一组数据越无序信息熵也就越高,极端时如果一组数据均匀分布,那么它的熵最大,因为我们不知道那种情况发生的概率大些。假如一组数据由构成,其和是,那么求信息熵的公式是:

分类预测算法属于有指导学习,方法是通过训练数据,按照参考属性对目标属性的依赖程度对参考属性分级别处理,这种分级别处理体现在创建决策树,目的是通过生成的判别树,产生规则,用来判断以后的数据。

5.2消费者消费行为分析

图 5.1 消费者行为分析模型

5.2.1重要保持客户CART消费分析

重要保持客户在整个消费者细分类中占了19.7%,对其消费套餐进行消费预

测,得到其相关规则,其中RW、FW、MW由RFM算法计算得到,年龄、性别由统计数据得到,将处理后的数据户经CART算法后,得到的决策树:

图 5.2重要保持客户CART消费分析决策树

运行得到决策树后,产生规则集:

图 5.3重要保持客户CART消费分析规则集

由上述条件得到,在重要保持客户中套餐3和套餐4使用较多,数据只够套

餐3和套餐4进行分析,并且如果年龄大于75.5岁,大多使用套餐3,并且在满足一定条件下,即消费金额较高时也会出现大多数选择套餐3。进而得到了相关参数的重要性:

图 5.4重要保持客户CART消费分析变量重要性

由上图可以得到,年龄对其影响较大,并且消费频率和消费金额对套餐的选

择影响也较大,在进行营销方案的制定时,可以分年龄阶段进行。

5.2.2重要挽留客户C5.0消费分析

重要挽留客户在整个消费者细分类中占了17.9%,对其性别进行相关分析,得到其相关规则,其中RW、FW、MW由RFM算法计算得到,套餐由统计数据得到,将处理后的数据户经C5.0算法后,得到的决策树:

图 5.5重要挽留客户C5.0消费分析决策树

在重要挽留客户中,性别和其消费频率、消费金额、最近消费时间以及性别有一定关系,且FW最重要,RW、MW和套餐的选择对消费者性别影响不大,可见男性和女性在消费行为上有一定的差别,男性较女性消费频率低,可能其一次性办理好了相关手续,而女性则不然,其在消费习惯上还是有很明显的差距和不同。所以在进行相关营销方案时,应当在男女消费行为上,主要是消费频率上可以制定相应的产品,如包月、包年或者一年内赠送多少等,以便更好推广。

图 5.6重要挽留客户C5.0消费分析变量重要性

由所建模型和输入数据得到其相应的规则,其中在重要挽留客户中,男性包含了4个规则,女性包含了5个规则,生成规则集如下:

图 5.7重要挽留客户C5.0消费分析规则集

5.2.3重要发展客户C5.0消费分析

重要发展客户在整个消费者细分类中占了20.77%,对其性别进行相关分析,得到其相关规则,其中RW、FW、MW由RFM算法计算得到,套餐由统计数据得到,将处理后的数据户经C5.0算法后,得到的决策树:

图 5.8重要发展客户C5.0消费分析决策树

在重要挽留客户中,性别受最近消费时间RW的影响较大,年龄次之,在进行重要挽留客户营销活动方案制定,可对消费时间最近的消费者进行重点营销。

图 5.9重要发展客户C5.0消费分析变量重要性

建模后将所有数据输入,经C5.0算法,得到规则集如下,其中男性规则有7

条,女性规则有6条。

图 5.10重要发展客户C5.0消费分析规则集

5.2.4一般价值客户CHAID消费分析

一般价值客户在整个消费者细分类中占了24.2%,对其性别进行相关分析,得到其相关规则,其中RW、MW由RFM算法计算得到,将处理后的数据户经CHAID算法后,得到的决策树:

图 5.11一般价值客户CHAID消费分析决策树

得到预测变量重要性如下图,其中性别、套餐、FW和消费者选择套餐的关联性不大,RW和MW与消费者套餐选择有一定相关性,其中RW相关性最高,在进行营销方案制定,可以针对性选择最近消费并且消费金额较高的消费者进行营销。

图 5.12一般价值客户CHAID消费分析变量重要性

将所有数据导入到模型中,最终生成规则集如下,在一般价值客户中,套餐

5、套餐6、套餐7消费最多,所输入数据只能对其进行分析,其和MW、RW的相关规则如下:

图 5.13一般价值客户CHAID消费分析规则集

5.2.5低价值客户CART消费分析

一般价值客户在整个消费者细分类中占了17.3%,对其性别进行相关分析,得到其相关规则,其中RW、MW由RFM算法计算得到,性别和年龄由统计数据得到,将处理后的数据户经CART算法后,得到的决策树:

图 5.14低价值客户CART消费分析决策树

在输入变量中,性别和年龄对消费者的消费选择影响较大,可见在不同年龄、

不同性别群体中,其消费观念和消费行为大为不同。由于该类为低价值客户,所以在进行营销时,为了避免过多的资源投入,可以着重选择性别和年龄进行营销策划和分析。

图 5.15低价值客户CART消费分析变量重要性

建立好模型后,将数据输入得到对应的规则集如下:

图 5.16低价值客户CART消费分析规则集

5.3实证研究的现实意义

本章使用了决策树CART决策树、CHAID决策树和C5.0决策树对移动通信消

费者消费行为倾向进行分类,并通过测试集进行预测。本章主要以消费者2014年度的消费数据对各方法来预测移动通讯消费者的消费倾向进行了验证和分析。

等招的是在研究主要有真实的数据,验证了栓子挖掘方法预测移动通信更多的消费倾向的功能,这样就能够掌握合适的时间序列数据。通过数据挖掘方法也可以预测移动通信客户未来一段时间的消费倾向不论是获得当前一段时间的消费倾向还是未来一段时间的消费倾向电信运营商都能够依据客户的身份证上在业务营销实施个性化推荐。提高客户业务影响力,从而提升业务的销售成功率降低营销过程中的盲目性。

6 总结与展望

6.1总结

随着信息化时代的来临,数据挖掘已经是一个相对成熟的研究领域。本文将

数据挖掘引进到移动通讯中,对已获取的大量数据进行分析,包含消费者的消费ID、消费者年龄、消费者消费金额、消费者性别这五项数据,从而完成对隐藏的、潜在的消费规律进行挖掘,从而完成更符合市场需求的营销方案,为提高企业的营销额以及企业和消费者之间的黏度起到重要作用。

本文在第一章对现有的研究情况进行了概述,分为数据挖掘的研究现状、客户关系的研究现状以及两者相结合的研究现状,在已有的相关理论基础上进行本文的研究。第二章则阐述了数据挖掘的相关理论,为本文的相关数据挖掘理论打好基础。第三章则是对消费者行为分析进行分析,将所得样本数据引入,进行RFM分析,从消费者的消费记录,即消费ID、消费时间和消费金额的到其R、F、M值,为接下来的消费者细分提供数据基础,按消费者价值对其分析,更加简单明了。

第四章则基于已处理的数据,进行消费者细分。通过K-Means、Two-Step和Kohonen聚类方法,分别进行聚类,最终选择了K-Means的细分结果作为消费者细分准则,得到五类消费者,即重要保持客户、重要发展客户、重要挽留客户、一般价值客户和低价值客户。在消费者细分的基础上,分别对不同类型消费者的消费行为进行分析更有意义。

第五章则通过CART算法、CHAID算法和C5.0算法,这三种算法对已分类的消费者进行分类分析,最终得到重要保持客户和年龄关系较大,重要挽留客户和消费频率关系较大,重要发展客户则和最近一次消费时间相关性高,一般价值客户和消费频率与消费金额有关,低价值客户则和性别有一定关系。针对此,在展开营销策划时,可以针对性进行营销。

6.2展望

本文最终完成了移动通讯消费者行为的研究和分析,但是在现有理论的研究

的基础上还是存在一定的问题,本文在数据统计上出现一定问题,即在第五章时,

有些细分客户预测分析不能使用CART或CHAID或C5.0,结合全文而言,以后可以进行如下部分,从而完善此次的研究:

① 扩大统计数据:由于当前数据统计工作还是不太完善,不能保证客户在

2014的消费都能被统计,存在数据丢失,并且由于进行消费者细分后,每类消费者的消费群体数都会降低,所以扩大统计数据有好处; ② 增加统计类别:本文所使用到的数据只包含了消费者的消费ID、消费者

消费时间、消费者的消费金额、消费者的年龄、消费者的性别这五项指标,可以拓展消费者是否退休、文化程度、收入等多项指标,更加全面进行恒定;

③ 着手实践:本文还是基于实地调研进行分析,得到了相关结论,但是在

实地检测和实践上还是需要后期相关公司的合作。

进行数据分析以及后期的验证都是一个长期的过程,不仅需要前期大量数据的统计,还需要后期的不断检验和完善,在不断实践中进行检验。

在3G时代,长尾效应变得越来越明显。移动运营商为其客户提供了各式各样的业务与服务,但是限于移动运营商缺乏精确运营的能力使得业务推广效果有限,不能够在合适的时间、合适的方式将合适的业务和服务提供给合适的客户,使得业务和服务的满意度偏低。在新形势下,传统的大众化的营销已表现出种种局限性的前提下,移动运营商应该建立起基于客户消费行为的营销管理系统,该系统应该以服务为根、客户为本,不但是一个业务营销服务的平台,而且是留住老客户发展新客户的有效工具。我认为一个有效的基于客户消费行为的营销管理系统应该具备以下三个特点:

1、可以作为移动运营商的“客户关系系统”。加强对移动通信客户特征和消费行为的研究,建立客户视图,帮助移动运营商管理好客户的同时发掘潜在的客户;

2、可以作为移动运营商发布定向广告的平台。利用手机用户的行为数据及内容数据,根据移动广告的形式,结合相应的推荐模型,能够以精准友好的方式推送及时有效的手机广告;

3、可以作为移动运营商精确营销的工具。通过数据挖掘提炼出大量用户消费行为规律的基础上,为客户精确个性化定制业务,并智能推荐。

但是,要建立起基于客户消费行为的业务营销服务平台还需要克服以下两个关键问题:

1、客户信息收集不完整。移动通信客户作为电信运营商宝贵的财富,经常得不到应有的重视,不能够保证对客户信息的持续跟踪收集和整理。例如,在客户基本信息中不能够体现客户从事行业的变更,而这些信息通常在建立客户视图

时是非常重要的;

2、客户个性化定制业务难以实现。山于客户需求的多样化和不确定性等原因,使得有需求的客户找不到合适的业务,而无需求的客户认为现在的业务没有用或用处不大,面对如此众多而又复杂的客户需求要实现业务的个性化定制无疑是难以实现的。

总之,面对种种机遇和挑战,全面有效的客户消费行为研究必将在未来的移动运营商智能业务营销服务中发挥其重要的作用和功效。

致谢

本文是在导师张婧老师的悉心指导下完成的。张婧老师根据我的工作经历和学科背景帮我确定了论文选题、在论文的框架确定上提出了宝贵的意见,在论文的写作过程中给与了相关理论的指导。并在论文的撰写和定稿过程,仔细审阅和严格把关。张老师渊博的学识、严谨的治学作风、平易近人的作风都使我受益匪浅且终身难忘。在此,谨向张老师表示真心的感谢和深深的敬意!

在三年多的学习时间里,在攻读项目管理硕士学位的日子里,我从学校课堂上,从授课老师身上学到了诸多宝贵的管理理论和知识,为我在实际工作的提供了宽阔的工作思路,在与老师和同学们的交流中,感受到一个良好的学术氛围,严谨向上的治学态度与学风。感谢华中科技大学管理学院的所有的老师们! 感谢与我互相勉励,共度紧张而难以怀念的求学时光的同学们!

此外,还要特别感谢我的家人!在我学习的三年多时间里,由于我本人一直在外地工作,学习时间只能在周末,我的家人长期以来对我学习给予全力支持。在他们的帮助和鼓励下,才使我最终得以顺利完成学业。

最后,向对我的论文进行评审和负责答辩的老师们致以诚挚的谢意!

参考文献

[1]Srikant R. Mining Quantitative Association Rules in Large Relational Tables[J]. Acm Sigmod

Record, 1996, 25:1--12.

[2]Liu G, Lu H, Yu J X, et al. AFOPT: An Efficient Implementation of Pattern Growth

Approach[J]. Proceedings of the Icdm Workshop, 2003.

[3]Dong G, Li J. Efficient Mining of Emerging Patterns: Discovering Trends and Differences[J].

Proceedings of the Fifth Acm Sigkdd International Conference on Knowledge Discovery & Data Mining, 1999:43--52.

[4]杨辉, 王浣尘. 用于数据挖掘的粗集产生多重知识库的方法[J]. 上海交通大学学报, 1998,

32(12):111-114. DOI:10.1088/0256-307X/16/9/020.

[5]陈玉泉, 朱锡钧, 陆汝占. 文本数据的数据挖掘算法[J]. 上海交通大学学报, 2000,

34(7):936-938. DOI:10.3321/j.issn:1006-2467.2000.07.021.

[6]Fryer D S, Peters R D, Kim E J, et al. Dependence Of The Glass Transition Temperature Of

Polymer Films On Interfacial Energy And Thickness[J]. Macromolecules, 2001, 34(16):5627-5634.

[7]Sengupta S, Bucklin L P. Organizing successful co-marketing alliances[J]. Journal of

Marketing A Quarterly Publication of the American Marketing Association, 1993, 57:págs. 32-46.

[8]Johnson E J, Moe W W, Fader P S, et al. On the Depth and Dynamics of Online Search

Behavior[J]. Social Science Electronic Publishing, 2004, 50(3):299-308.

[9]张玉峰, 晏创业. 基于Agent的个性化信息服务模型研究[J]. 情报学报, 2001, 20(5):555-559.

DOI:10.3969/j.issn.1000-0135.2001.05.008.

[10]陈莉, 焦李成. Internet/Web数据挖掘研究现状及最新进展[J]. 西安电子科技大学学报:自

然科学版, 2001, 28(1):114-119. DOI:10.3969/j.issn.1001-2400.2001.01.027.

[11]Kim J, Suh E, Hwang H. A model for evaluating the effectiveness of CRM using the

balanced scorecard[J]. Journal of Interactive Marketing, 2003, 17(2):5--19.

[12]Chang H J, Hung L P, Ho C L. An anticipation model of potential customers’ purchasing

behavior based on clustering analysis and association rules analysis[J]. Expert Systems with Applications, 2007, 32:753–7.

[13]向勇. 基于客户行为的汽车服务业库存管理研究[D]. 武汉理工大学, 2009.

DOI:10.7666/d.y1474420.

[14]王振东. 聚类算法及其在客户行为分析中的应用研究[D]. 北京邮电大学, 2008.

[15]童建飞. 数据挖掘在电信移动客户行为分析中的应用研究[D]. 南昌大学, 2010.

[16]Berson A, Smith S J. Building Data Mining Applications for CRM[M]// Building Data Mining

Applications for CRM. McGraw-Hill Companies, 1999.

[17]Data C. Data Mining: Concepts And Techniques[J]. San Francisco, 2010, 29(S1):1 - 18. [18] Kimball, Ralph, and Margy Ross. The data warehouse toolkit: the complete guide to dimensional modelling. New York ua (2002). 125-150

[19] Nisbet, Robert, John Elder IV, and Gary Miner. Handbook of statistical analysis and data mining applications. Academic Press, 2009.

[20] Pawlak, Zdzisław. Rough set approach to knowledge-based decision support. European journal of operational research 1997, 99(1): 48-57.

[21] Friedman, Nir, Dan Geiger, and Moises Goldszmidt. Bayesian network classifiers. Machine learning 1997,29(2): 131-163.

[22] Mcculloch W S, Pitts W. A logical calculus of the ideas immanent in nervous activity[J].

Bulletin of Mathematical Biophysics, 1943, 5(4):99–115.

[23] Holland, John H. Adaptation in natural and artificial systems: an introductory analysis with applications to biology, control and artificial intelligence. MIT press, 1992.

[24] 中国客户关系管理网http://www.crmchina.com/web/research.asp?stype [25] 汤兵勇.客户关系管理[M].北京:高等教育出版社.2003

[26] 陈玉保,刘宏,段红彬.营销理论的新发展:客户关系管理(CRM)理论[J].商业研究.2002.(14):77~79

[27] 梁小民.高级宏观经济学教程(上册)[M].北京:北京大学出版社,1993.111~111

[28] 符国群.消费者行为学(上)[M].北京:高等教育出版社,2001.23~23

[29] 陈静宇.基于一对一营销的客户行为模式研究[J],商业经济与管理,2003(3):19~23

[30]黄发良,钟智.用于分类的支持向量机.广西师范学院学报自然科学版.2004,9:75.78页.

[31]曲守宁,董彩云,徐德军,吴桐.关联规则算法研究及其在教学系统中的应用.计算机系统应用.2005,4:20.23页.

[32]韩永奇,张芸,姚玉霞.基于关联规则数据挖掘算法的应用.农业网络信息.2008,11:73.75页.

[33]何建忠,吕振俊.基于两个矩阵的关联规则挖掘优化算法.计算机工程.2008,1 7:56.61页.

[34]T,Swami Agrawal,Imielinski,A,Mining association rules between sets of otems in large databases.proc.1 993 Acm Int.Conf.Management Of Data.Washington,DC.207·2 1 6P

[35] LAVIDGE R.J., and G.A. STEINER. A Model for Predictive Measurement ofAdvertising Effectiveness[J] .Journal of Marketing 25 (October 1961):59~62 [36] [37]

Dwyer

F,Robert,Schurr

Donner.

Paul What

H,Oh Can

Sejo.Developing Customer

Buyer-Seller Segmentation

Relations[J].Journal of Marketing,1987,51(4):11~28

Suzanne

Accomplish?[J].BankerMagazine.1992,175(2):72~81 [38]段智敏,王如龙,孙美青.基于一卡通的数字化校园资源整合研究与实现.计算机工程与科学,2008,(1):8.11

[39]罗可,蔡碧野数据挖掘及其发展研究.计算机工程与应用,2002,14(2):182.184

[40]李峥嵘,柴彦威.大连城市居民周末休闲时间的利用特征.经济地理,1999 (5):80-84

[41]周星.大学生日常休闲活动的动机与障碍.中国青年研究,2005,(8):80—83 [42]

Kadanoff.Marcia.Zoning

and

Cloning

Your

Best

Customers[J].MC:MarketingComputers,1995, 15(8): 27~29

[43] Jim Sellers, Arthur Hughes. RFM Analysis:A New Approach to a Proven Technique[DB/OL]. http://www.relationshipmktg.com/FreeArticles/rmr017.pdf

这个是导师的意见就加两点, 1是趋势 2是实例。 实例应该是加在3.4.5章实证的章末。 对于你来说都很简单啦。 明晚发我哈。我看了没啥问题我就付你钱。 数据挖掘 移动通信 消费者的行为分析的趋势和展望

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- aiwanbo.com 版权所有 赣ICP备2024042808号-3

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务