登录    注册    忘记密码

详细信息

基于代价敏感随机森林算法的电信流失用户识别研究    

文献类型:学位论文

中文题名:基于代价敏感随机森林算法的电信流失用户识别研究

作者:张雪燕[1];

第一作者:张雪燕

机构:[1]河南财经政法大学;

第一机构:河南财经政法大学

导师:刘定平;河南财经政法大学

授予学位:硕士

语种:中文

中文关键词:流失用户识别;最小错分代价;代价敏感随机森林;类型权重参数;最优属性选择

摘要:争取潜在用户以及挖潜现实用户是行业竞争中的两个基本手段,而在电信行业中,由于增加新用户的困难性,往往迫使其转向对既得利益的维护和增值,也即致力于对现有用户价值的挖掘。相关研究表明,因用户流失所造成的损失将远高于新增用户所带来的利润。为了满足在竞争环境中的生存需要,高效识别并预防用户流失成为电信运营工作的重要环节。电信行业的用户流失识别属于典型的不平衡数据分类问题,而传统基于最小错分率建立的分类器,以错分代价相同为假定前提,未从客观现实角度考虑错误分类所带来的损失,从而准确识别流失用户的能力相对较弱。实际上对于流失用户的错误识别所付出的代价要比非流失用户的错误识别更为高昂。为提高流失用户的识别性能,本文基于代价敏感学习的思想,首先根据数据的不平衡性对两种错分情况赋予相应的代价;其次从直接提高流失用户的权重,以及通过修正基尼指数的计算过程以增加流失用户的入样概率两种角度出发,将代价信息通过设置类型权重参数和改进最优属性选择计算方式这两种思路,嵌入到随机森林中。建立以最小错分代价为目标的代价敏感随机森林分类模型,并应用于某电信运营商流失用户的识别研究;最后识别流失用户的最终目的在于发现并克服运营商的业务漏洞,实现用户留存与维系。结合探索性数据分析和文本数据挖掘的优势,在充分探究流失用户的行为特征后,本文对用户使用运营商服务的评论数据进行深入解读,发掘影响用户留存的痛点问题,以便电信运营商根据用户需求适时调整发展方向。在验证模型的有效性时,将代价敏感学习后的结果分别与传统分类模型和重采样技术进行比较。结果表明:(1)基于代价敏感学习的随机森林算法显著提高了流失用户的查全率,并且在分类预测的一致性程度和平均误分代价等指标上表现出一定的优势;(2)在代价敏感随机森林的两种构成方式中,通过改进最优属性选择计算方法建立的代价敏感学习模型,分类结果要优于设置类型权重参数的方式;(3)通过对流失用户的影响因素进行考察得出,用户在网时间较短、套餐期限选择有限、互联网供应商为光纤、以及客服的服务态度和网络的速度与质量等因素对用户流失作用较为显著,应当引起电信运营商的重视。

参考文献:

正在载入数据...

版权所有©河南财经政法大学 重庆维普资讯有限公司 渝B2-20050021-8 
渝公网安备 50019002500408号 违法和不良信息举报中心