【赛题发布】2015年第一届“好贷杯”中国高校风险管理与控制能力挑战赛决赛赛题
2015年第一届“好贷杯”中国高校风险管理与控制能力 挑战赛决赛赛题赛题8.7日有更新,详情请见 底部标红区域
近年来,互联网金融火爆发展,弥补了传统金融行业对于小额贷款的缺位状况,解决了小微企业以及个人在贷款方面的需求。但是,随之而来的就是P2P 金融行业的风险管理问题。大多数企业用的是线下纯人工审核的方式,按照风控人员的经验来审核贷款申请,没有利用量化手段去准确评估客户的资质,这就造成效率低下,成本高昂和标准不统一的问题。用量化手段帮助企业用科学的方法控制风险,是企业的强烈需求。在这种情况下,“好贷杯”中国高校风险管理与控制能力挑战赛以帮助解决企业实际问题为目的,培养学生了解市场,学以致用为手段,通过数学模型的方式探求互联网金融新业态下的风控之路。
决赛试题所用到的数据为“好贷网”的申请贷款模拟数据,以及获贷结果数据。这些数据,实际上已经经过几个步骤的数据清洗,是在实际建模过程中的一个中间状态。组委会希望选手们从实际出发,以此数据为基础,建立以获贷结果成否为结果数据的模型。
数据说明:1. 数据集Apply.sas7bdat 是14783 条申请纯信用贷款的数据,其中分为个人申请和企业主申请。2. user_info.sas7bdat 是申请人信息,但是不完全,只有部分user有信息,共3052条。数据结构和字段是完整的,但总条数不够,不能完全匹配到申请表中的14783 条申请。3. 数据集Apply.sas7bdat 中的remark,detail,review 包含部分user 信息,其中review字段是电话审核员的审核记录,是以字符串格式存储;remark,detail 字段,是根据不同的type值,以特定格式存储了部分user 信息。4. 申请是否获贷,考察两个变量:sms_reply 和 xd_score。其中sms_reply 是申请贷款客户短信回复是否获贷;只有部分回复有值。xd_score是客服回访申请人获贷状况。如果sms_reply 和 xd_score逻辑矛盾,则数据不能用。5. 数据含义,请参考考题-数据字典.xlsx。
建模要求:建立个人申请和企业主申请的获贷模型。
要点提示:1. 拆分申请表中的用户信息,拼出宽表,也叫分析表(Analytic table) - 就是最终用来做分析,每条记录同时包含申请信息,客户信息,获贷结果信息的数据集。2. 模型需要验证。企业在实际工作中重点考察C值,KS值,ROC值。
2015.8.7 内容更新
考题--数据字典
补充了 salary 、 salary_public 、 salary_private 、 card_limit 、 card_time 、 card_overdue、 money、month 详情说明,详情见附件。
关于salary的分组是建议分组,学生们可以根据apply表中实际情况进行自行处理。
非常感谢了,谢谢! {:3_41:}看一看! 哇哦。来看看赛题 啦啦啦啦啦啦啦啦啦啦啦啦啦 好好好哈或或或或或或或或或或或或 好好好哈或或或或或或或或或或或或
好好好哈或或或或或或或或或或或或
页:
[1]