详细信息
基于集成分类算法的P2P网贷违约预测模型研究
文献类型:学位论文
中文题名:基于集成分类算法的P2P网贷违约预测模型研究
作者:李文豪[1];
第一作者:李文豪
机构:[1]河南财经政法大学;
第一机构:河南财经政法大学
导师:景丽;河南财经政法大学
授予学位:硕士
语种:中文
中文关键词:P2P网络借贷;集成学习;随机森林算法;LightGBM算法;不平衡数据
摘要:P2P(Peer-to-Peer)网贷是个人对个人的一种基于互联网平台的网络借贷模式,它作为互联网金融的重要代表,为借款人与投资人打通了一条便利的投融资通道。伴随着国内网贷行业的快速发展,P2P网贷违约事件频出,对投资人权益和平台正常运行造成不利影响。违约预测模型可以识别出高风险的借款人,P2P平台利用此模型可以帮助出资人更准确得作出决策,但目前由于P2P网贷平台面临着数据繁杂、数据分布不均衡等问题,难以建立有效的违约预测模型。为解决上述问题,本文利用集成分类算法的分类精度高、不易过拟合、泛化能力强且适合复杂数据集等特点,构建违约预测模型,且针对数据集中正常还款与违约样本数量差距较大,即数据分布不均衡问题,利用采样技术进行均衡化处理,以提升模型分类性能。具体工作:首先进行数据分析与处理,研究了数据的分布情况和变量类型,并通过数据清洗、特征工程确定了风险预测模型的重要指标;然后利用随机森林算法与LightGBM(Light Gradient Boosting Machine)算法构建违约预测模型,对参数进行调试,并针对数据不均衡的特点,分别选择SMOTE(Synthetic Minority Oversampling Technique)过采样、随机欠采样和“SMOTE
参考文献:
正在载入数据...