随着大数据技术的日趋成熟,从商业科技到金融、zf、教育、e疗以及社会其他各个领域,大数据的影响力已经深入到世界的方方面面。其中,金融作为一个以数字体现价值的典型行业,中腾信已将大数据技术广泛应用于风险控制、客户管理、精准营销和产品服务创新等多个领域。
大数据风控作为前沿技术在金融领域的最成熟应用,让高效的量化风控有了更多的想象力。然而,大数据风控作为一个新生事物,目前还处在摸着石头过河的阶段,数据来源的质量问题、风控模型的有效性问题、数据获取与用户隐私保护的平衡问题等,仍然是从业机构需要正视的问题。
a面:应用场景与优势
据麻袋研究院和金融城联合发布的《消费金融风控白皮书》,所谓大数据技术是通过对海量数据进行数据整合、数据预处理、数据校对等方式把结构化数据以及非结构化数据进行清洗、抽取、转换成需要的数据,同时还可以保障数据的安全性以及完整性。
大数据技术是消费金融风控系统的基础,目前,大数据抓取及数据处理技术主要应用于预授信、反欺诈模型、信用评分等环节。
例如,预授信方面,根据不同信dai产品的特性,利用大数据库创建白名单,对潜在用户进行预授信,然后定向邀请。在反欺诈方面,一般采用多种策略综合验证打击欺诈攻击,解决方案包括采用逻辑违规算法,将多个弱相关变量放在一起建模;设立反欺诈“黑名单”,拦截有不良欺诈记录的申请者;对群体性欺诈攻击,进行集群分析,利用 sas 链式聚类技术,实现无限层次申请链接分析等。信用评分则指的是通过收入计算模型、额度计算模型、人行评分模型等,从多个维度判断客户的授信额度,以快速处理大量信dai申请。
大数据风控无论是在采集数据的种类和数量上、数据处理的速度上,还是在最终的效果上都远超传统型风控:
大数据风控利用多维数据,可打破客群局限。大量非传统金融数据的分类提取和分析,可更全面地进行用户画像和风险评估,让金融机构在风险可控的前提下服务那些传统风控模式无法评估的群体。
大数据风控可实现自动决策,实时审批。基于大数据风控模型,可提供7*24小时的服务,线上提交申请后,授信审批、额度发放等过程全自动运营,大幅缩短等待时间,提升了用户体验。
大数据风控学习速度快。传统风控主要基于人工,而人的知识、能力和经验,在短期内不会有较大变化。大数据风控更新频率很高,随着人工智能、深度学习等技术的发展,大数据风控的科学性、准确性会越来越高。
最后,大数据风控可以更有效地进行dai中和dai后控制。大数据风控在dai中阶段能随时监控用户交易行为,发现警报后马上处理,停止相关交易;在dai后则可以有针对性地采取催收措施,提高还款率。
大数据技术在完善其风控流程,降低成本、提高效率、改善用户体验等方面拥有突出优势,中腾信及旗下小花钱包即得益于大数据风控技术的成熟应用,在信dai审批效率和风控质量等方面领先于同业,并因此被纳入金融城《消费金融风控创新白皮书》案例,以及央行金融研究所编写的《金融科技:发展趋势与监管》经典案例。
以小花钱包为例,通过纯线上的大数据风控技术提高放款效率,其结合云计算和大数据模型,自主研发出riskai系统。在欺诈识别服务方面,小花通过与多家第三方征信机构合作,利用多维度征信数据对用户进行交叉核实与画像,杜绝批量集中的恶意欺诈风险;riskai系统还可提升业务自动化程度,实现自动精准获客,自动化风险识别辅助技术,自动化系统运维,将系统响应效率不断提高,极大提升用户体验。目前riskai已实现每天处理2万件,件均处理时效平均仅需3-5分钟,极大地提升了处理效率。
b面:三大挑战与未来前景
值得注意的是,大数据风控作为一个新生事物,仍然面临三方面的挑战:
第一,孤岛数据融合难,准确性不足。由于各家数据机构的数据没有打通,孤岛问题造成数据来源不够丰富,维度不够多样,同时由于各个大数据公司在数据收集和清洗方式不同,会造成数据污染,这样输出的数据会有一定的不准确性。
第二,数据滥用,泄露用户隐私。很多公司在数据收集和使用的时候,存在侵犯用户隐私的不规范操作行为,如数据非法交易和盗取信息,这直接导致数据的滥用和隐私的泄露,并引发用户对于数据安全问题的担忧。
第三,风控模型存在逻辑弱点,没有验证调整的时间。传统的风控技术已经历三十年、五十年周期的迭代,但大数据风控没有经过完整经济周期的考验,一旦出现黑天鹅事件会冲击风控模型的基本假设,进而影响大数据风控的有效性。
中腾信相关负责人指出,尽管目前大数据风控的有效运用尚存在诸多障碍,但长远来看,在消除障碍、解决问题中前行,才是大数据风控发展的必然趋势。
以业界最为关注的数据获取与用户隐私保护的平衡问题为例,中腾信坚持许可原则,所有数据经用户同意授权方可使用;其次,对数据的访问进行访问权限和访问行为的双重监控;再次,数据的使用与分析仅用于信dai审批、风险评估环节,对原始数据进行保护,不进行交易;最后,在不违反系统规则的条件下,对真实数据进行改造并提供测试使用,实现敏感隐私数据的可靠保护。
在保障用户隐私的前提下,中腾信一直在大数据风控领域积极探索,解决问题并逐步形成了三大优势:
第一、数据源丰富,业务应用成熟。在基础数据方面,中腾信与多家业内领先征信及数据机构合作,并加入中国互联网金融协会信用信息共享平台,充分覆盖各类消费信dai人群的信用数据。结合中腾信自身5年多的业务数据,形成亿级风险数据沉淀,为智能风控提供大量的数据支持。
中腾信在运营商数据方面的应用也十分成熟。运营商数据覆盖几乎100%的人群,通过运营商基础数据信息可以核实客户身份,还可以分析评估客户的消费能力及收入水平、通讯行为是否异常等,从而评定该客户的工作稳定性、经济能力以及欺诈可能性。
第二、云计算能力突出,数据安全稳定存储。据了解,中腾信采取的是个人敏感数据本地存储,非敏感数据上云的混合部署模式。混合云的应用既保证业务的安全性又实现资产的动态扩展和灵活管理。此外,云计算的大面积使用,带来算法能力的提升,提升了数据分析处理的能力,为大数据的广泛应用提供了基础。
第三、深入理解消金场景,数据挖掘加工处理能力强。中腾信有自营金融业务的实践基础,深度理解业务场景与需求,形成了处理不同来源数据(结构、非结构化)的能力。
以反欺诈环节为例,中腾信以大数据为技术支持,通过多种手段来有效地核实用户身份,防止身份冒用、第三方欺诈等风险,识别高风险交易特征,有效地交叉验证用户信息的真实性,将欺诈行为防范于发生之前。
如果说,风控是金融的心脏,那么数据就是风控的血液。业内人士指出,风控与大数据结合、不断完善和优化风控制度和体系,对于金融科技公司和传统金融企业而言都同等重要,而要解决大数据风控发展中的问题,需要产业链各方的共同努力。
令人欣喜的是,关于个人信息保护的问题已引发zf及监管部门的重视,相关法律法规正在逐步完善中,与此同时,随着百行征信的成立和更多机构的接入,数据孤岛的问题正在得到有效解决,数据获取的门槛逐步降低,大数据风控的基础正在逐步夯实。在逐步向好的产业环境中,中腾信表示将利用大数据算法,进一步提升优化、提升风控能力。