国内外个人信用分理论研究
国内研究动态
我国在个人征信体系建设方面与发达国家相比起步较晚、基础薄弱,但近年来发展节奏明显加快。经过多年的探索,目前我国已初步建立了以中国人民银行个人征信系统为基础、其他市场化运作商业机构作为支撑的个人征信体系。国内学者在个人信用方面的研究主要集中在互联网金融背景下个人征信模式创新和个人信用评估方法两个方面,具体的研究脉络梳理如下。
在互联网金融背景下个人征信模式创新研究方面,宋世伦、刘岩松(2012)认为,基于最新的图像识别、人工智能等互联网技术可以使用于个人信用建设的数据来源更加丰富,数据采集成本更加低廉,个人征信机构能够提供的个人征信产品和服务更加多元化。袁新峰(2014)认为,建立征信系统的互联网金融子系统的重点是加强互联网征信的隐私保护以及开展互联网金融模式下的信用评分业务。同时,互联网金融背景下大数据在个人征信体系中将发挥重要作用。冯文芳、李春梅(2015)认为,基于大数据基础个人征信方法能够收集和处理非结构化数据,这些数据来源广泛,有助于提供更为全面和精确的个人信用评价,可靠性和实用性更强。卢芮欣(2015)认为大数据可以有效扩大征信的覆盖范围,拓展信用信息的来源,为信用数据安全存储和全面共享奠定基础,有效拓展信用数据的挖掘深度。
在个人信用评估方法研究方面,陈哲赞(2012)主张在个人信用评估中使用统计方法,并重点阐述了如何运用Logistic回归分析方法对个人征信进行评估。李太勇等(2013)引入了基于稀疏贝叶斯理论的新型个人信用评估模型,并且通过实证表明该方法效果显著,可以获得较高的辨识度。在非统计学方法研究上,杜婷(2012)将粗糙集相关理论与支持向量机理论相结合进行预测,把粗糙集支持向量机方法应用在个人信用评估的研究中。刘艳芳(2015)通过研究分类器选择方法,提出了一种基于该方法的最优基分类器子集搜索算法和选择标准,并在此理论基础上创建了新的个人信用评估模型。
与此同时,一些学者也探索了信用评估方法中的组合方法,姜明辉等人(2014)设计出了基于Logistic回归-BP神经网络的权重调整算法和基于距离的投票算法,对以CBR(案例推理)方法建立的个人信用评分模型进行优化,设计出精确性和准确性都有所提高的基于优化CBR的个人信用评分模型。冯金龙(2016)通过米用Logistic回归、支持向量机和人工神经网络三种单一模型,创建新的组合式个人信用评估模型——Logit-GA-BP组合模型,并且运用该模型进行实证分析,结果表明可以对目标群体的违约风险进行有效的预警提示。
国外研究动态
经过100多年的发展,国外发达国家已经形成了相对完善的信用体系一信用法律体系、监管体系、征信体系等,建立了丰富的数据源和完整的体系结构。在此基础上,国外学者对个人信用评估机制进行了广泛深入的研究,特别是对个人信用分的研究取得了众多突破。
在互联网金融方面,Freedman S.等(2008)指出互联网金融的发展使征信数据来源更广泛,比如一些P2P网络平台揭露的借款人的“软信息”有利于补充个人征信的“硬信息”。Crosman P.(2012)通过实证研究,认为随着机器学习和有关互联网技术的发展,基于个人线上线下有关数据可以对个人的信用状况进行有效评估,并将随着个人征信技术的不断进步,可用于个人信用评估的指标也会越来越多,从而有助于得到更加精确的个人画像。Hoofnagle C.J.(2013)则指出,由于个人信用评价指标较为单一,加之缺乏有效的数据整合能力,美国部分网民仍无法享受征信带来的便利。
国外学者在个人信用评分理论研究方面将重点放在数理模型技术方法分析上,通过设置多重变量,研究各种因素对评估质量和制度环境的影响,并着重分析如何将统计学方法运用在个人信用评估上。
Wiginton J.C.(1980)首次将Logistic回归方法引入到了个人信用评分领域。Anderson J.A.(1981)则分析研究了与Logistic回归相似的Probit回归模型的效果,并与判别分析方法进行对比,得到Probit方法判别性能更好的结论。Rosenberg E.和Gleit(1994)两位学者通过对个人征信评估中使用判别分析方法进行实例验证,得出了分析方法的可行性。
随着研究的深入,个人信用评分技术领域逐渐出现了决策树、贝叶斯等非参数的统计方法。Kim Larsen(2005)通过分析运用广义朴素贝叶斯分类理论,填补了该方法在个人信用评估领域中的空白。Zhang Defu等(2010)提出了Vertical Bagging决策树模型,并运用UCI数据库中数据对该模型进行验证,结果表明该模型是一种可行的征信评估模型。Ling-Jing Kao(2012)提出将分类回归与贝叶斯线性回归相结合方法对个人信用进行预测。
随着互联网信息技术的进一步发展,支持向量机、神经网络等系列非统计方法以及组合方法的概念也逐渐引用到信用评分领域。Sun J.和Li H.(2008)通过使用加权投票法对多种个人信用评分模型进行了组合,得出组合模型在预测稳健性和精度方面都较高的结论。Alexis Marcano(2011)提出将神经网络相关方法运用到信用评估研究领域,建立了一种可塑性人工神经网络模型,然后利用相关数据进行了实证研究。Finlay S.(2011)通过构建多种Bagging和Boosting组合模型,在与单一模型的对比后发现组合模型在信用评分领域具有很好的效果。Paulius Danenas等学者(2011)采用了特征选择以及支持向量机的相关理论,对个人信用进行建模,经过验证得到了良好的结果。Amir Arzy Soltan(2012)则通过对伊朗和澳大利亚两国信用数据运用决策树和人工神经网络组合的信用评估方法,成功验证了该组合方法的可行性。
2
国内主要个人信用分指标设计比较分析
目前,我国国内已有5个典型城市以及阿里巴巴为代表的互联网公司开展个人信用分评定及应用工作。这些城市通常会根据自身发展特点、发展阶段以及软硬件条件对个人信用分进行分门别类的设计。根据个人信用分评分体系的不同,目前国内主要城市信用大致分为两类:一类是FICO评分系统(美国FICO公司开发的个人信用评分系统),另一类是更为复杂的多维体系。

采用传统FICO评分系统的个人信用分
目前,国内采用FICO评分系统设定个人信用分的城市和机构有厦门、苏州以及蚂蚁金服。具体的指标设计如下。
1.厦门“白鹭分”
厦门市民个人信用“白鹭分”是以行政管理过程中以及市民城市生活中产生的个人信用数据为依据,通过搭建信用修复、基础信息等5个指标,对市民进行精准用户画像,区分市民信用等级,以此划分为不良、一般、良好、优秀、极好等5个等级。该城市信用分还预留了部分权重指标,未来将按照平等互换原则与民间征信体系对接,逐步将其打造成为一个集公共信用评定、民间信用评价于一体的国内城市个人信用综合评定体系。
2.苏州“桂花分”
该信用分通过区分市民基础、稳定、品德、资产以及其他信息,从中抽取5个评定维度,再根据市民的文化程度、年龄、户籍等搭建22大类总计243个指标项,综合评定市民的信用等级。另外,苏州市还注重与具有线上大数据优势的互联网企业合作,共同开展个人信用服务。比如,通过与互联网巨头阿里巴巴集团合作,融合引进旗下产品——“芝麻信用分”,填补了其在互联网征信环节的不足,打通了“数据—模型—场景”。
3.蚂蚁金服“芝麻信用分”
阿里巴巴集团旗下产品“芝麻信用分”采用了较为成熟的FICO评分体系。该信用分从自然人履约能力、信用历史等5个方面进行综合评定,依所处分数区可以分为5个等级,即极好(700~950分)、优秀(650~700分)、良好(600~650分)、中等(550~600分)、较差(350~550分)。
采用多维评分系统的个人信用分
目前,国内通过设计多维指标体系进行个人信用分评定的城市有宿迁、福州和杭州。采用多维指标体系进行个人信用分评定可以增加测评的完整性和准确度,确保衡量结果客观,缺点在于增加了研发难度。
1.宿迁“西楚分”
该个人信用分指标数据来源于本市公共信息平台归集的个人信用数据,并通过划分社会管理信用信息、商务信用信息等多维度,总共设置69个指标项综合计算得出结果。目前,“西楚分”采取千分制评价方法,根据用户信用评分段进行A、B、C、D等4个级别以及AAA、AA、A+等8个等级评定,并且计算采用直接降级法和指标加减法。
2.福州“茉莉分”
福州市“茉莉分”指标数据来自于本市公共信息平台采集的个人信用数据,通过科学搭建评价模型,区分个人能力、职业、公共信用、金融信用、行政信用、司法信用等6大维度,通过大数据分析计算得出。该个人信用分目前采

