登录    注册    忘记密码

详细信息

基于集成分类算法的P2P网贷违约预测模型研究    

文献类型:学位论文

中文题名:基于集成分类算法的P2P网贷违约预测模型研究

作者:李文豪[1];

第一作者:李文豪

机构:[1]河南财经政法大学;

第一机构:河南财经政法大学

导师:景丽;河南财经政法大学

授予学位:硕士

语种:中文

中文关键词:P2P网络借贷;集成学习;随机森林算法;LightGBM算法;不平衡数据

摘要:P2P(Peer-to-Peer)网贷是个人对个人的一种基于互联网平台的网络借贷模式,它作为互联网金融的重要代表,为借款人与投资人打通了一条便利的投融资通道。伴随着国内网贷行业的快速发展,P2P网贷违约事件频出,对投资人权益和平台正常运行造成不利影响。违约预测模型可以识别出高风险的借款人,P2P平台利用此模型可以帮助出资人更准确得作出决策,但目前由于P2P网贷平台面临着数据繁杂、数据分布不均衡等问题,难以建立有效的违约预测模型。为解决上述问题,本文利用集成分类算法的分类精度高、不易过拟合、泛化能力强且适合复杂数据集等特点,构建违约预测模型,且针对数据集中正常还款与违约样本数量差距较大,即数据分布不均衡问题,利用采样技术进行均衡化处理,以提升模型分类性能。具体工作:首先进行数据分析与处理,研究了数据的分布情况和变量类型,并通过数据清洗、特征工程确定了风险预测模型的重要指标;然后利用随机森林算法与LightGBM(Light Gradient Boosting Machine)算法构建违约预测模型,对参数进行调试,并针对数据不均衡的特点,分别选择SMOTE(Synthetic Minority Oversampling Technique)过采样、随机欠采样和“SMOTE

参考文献:

正在载入数据...

版权所有©河南财经政法大学 重庆维普资讯有限公司 渝B2-20050021-8 
渝公网安备 50019002500408号 违法和不良信息举报中心