任何大數(shù)據(jù)方法用于信用風(fēng)險的評估都要滿足這三個條件
王蕾 | 2018-02-22 11:44
【數(shù)據(jù)猿導(dǎo)讀】 訪談:鄂維南,中國科學(xué)院院士,北大元培學(xué)院院長,普林斯頓大學(xué)數(shù)學(xué)系和應(yīng)用數(shù)學(xué)研究所教授

大數(shù)據(jù)和大數(shù)據(jù)技術(shù)
王曉蕾(以下簡稱“王”):很高興鄂院士在百忙中接受我們的采訪。根據(jù)我的初步理解,目前大數(shù)據(jù)在金融中的運用,主要是通過大數(shù)據(jù)做風(fēng)險控制,建立風(fēng)險模型預(yù)測還款可能性,從而決定授信額度和定價。您怎樣看待大數(shù)據(jù)在風(fēng)險管理中的應(yīng)用?
鄂維南(以下簡稱“鄂”):要講清楚這個問題,我們首先要區(qū)別一些概念,首先是大數(shù)據(jù)和大數(shù)據(jù)技術(shù),前者是指的數(shù)據(jù)及可用于風(fēng)險管理的數(shù)據(jù)問題,后者是指一些諸如機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)等大數(shù)據(jù)算法。
從數(shù)據(jù)源的角度,我認(rèn)為,與個人有關(guān)的信息從外到里可以分為三層:第一圈是關(guān)于個人的所有信息,第二圈是關(guān)于個人的所有履約信息,第三圈是信貸履約的信息。在之前傳統(tǒng)的風(fēng)控中,我們一般利用最里圈的信貸履約信息,加上部分個人基本信息等來預(yù)測信貸違(履)約情況。隨著互聯(lián)網(wǎng)和信息技術(shù)的發(fā)展,部分方便可得的外圈信息,對于內(nèi)圈的履約預(yù)測慢慢地被證明有一定的效果,例如打車的履約情況對信貸履約的判斷是一個依據(jù),因此大數(shù)據(jù)風(fēng)控隨之逐漸興起。但對于不同圈別數(shù)據(jù)的跨圈使用,特別是外圈數(shù)據(jù)往內(nèi)圈使用的過程中,要特別解決法理約束和本人授權(quán)兩個問題,這樣有利于各種數(shù)據(jù)在風(fēng)險評估領(lǐng)域中的可持續(xù)使用。
王:您這樣說非常清楚。目前,部分放貸機(jī)構(gòu)對替代性數(shù)據(jù)(Alternative Data)的使用,我的理解就是對非現(xiàn)金化的債務(wù)履約信息的使用。當(dāng)消費者缺乏信貸債務(wù)及其履約信息時,可以利用這些水電煤等先消費后付款的信息,通過考察消費者的重復(fù)履約意愿和能力來進(jìn)行信貸風(fēng)險管理。我們熟知的美國澤斯塔(ZestFinance)金融公司,所使用的“替代性”數(shù)據(jù)主要包括水電燃?xì)赓M等先消費后付款消費信息,當(dāng)然,信息主體本人授權(quán)是一個基本原則。
鄂:以上說的是大數(shù)據(jù)問題,再從大數(shù)據(jù)技術(shù)角度來看,任何大數(shù)據(jù)方法用于信用風(fēng)險的評估,要滿足三個條件:一是明確的,對評分建模的方法論、過程和數(shù)據(jù)使用上是明確的,對監(jiān)管、對公眾是應(yīng)該公開的:二是準(zhǔn)確的,建立的模型要對不同風(fēng)險狀況的人群有區(qū)分能力和排序能力;三是穩(wěn)定的,數(shù)據(jù)、方法和模型在人群、時間跨度上是穩(wěn)定的。從傳統(tǒng)的邏輯回歸,到?jīng)Q策樹,再到機(jī)器學(xué)習(xí)等大數(shù)據(jù)方法的使用,要始終堅持開發(fā)出來的模型“明確、準(zhǔn)確和穩(wěn)定”的三大特點。
王:據(jù)我了解,有些利用大數(shù)據(jù)中的機(jī)器學(xué)習(xí)技術(shù)開發(fā)的模型是明確的,有些是不明確的。
鄂:是的。總體而言,對于大數(shù)據(jù)和大數(shù)據(jù)技術(shù),目前,在風(fēng)險控制中,可以是在遵守一定規(guī)則上開放性使用,但是對于征信領(lǐng)域,在數(shù)據(jù)的來源上建議適當(dāng)保守些,這主要是征信對評分開發(fā)模型的明確性要求更高。但是盡管如此,在數(shù)據(jù)的處理方法上,都可以進(jìn)行不同的嘗試和探索,因為大數(shù)據(jù)技術(shù)的發(fā)展,就是將可以使用的信息,包括傳統(tǒng)的信息和現(xiàn)實生活中映射到互聯(lián)網(wǎng)的各種信息極大的簡化為一個分?jǐn)?shù),供放貸機(jī)構(gòu)高效、便捷的使用。
風(fēng)控與征信之異同
王:按照您剛才說的,我理解是,一些熱門的大數(shù)據(jù)技術(shù)可以做風(fēng)控、但不能做征信,為什么這么說呢?
鄂:要理解這個觀點,得先從風(fēng)控和征信的本質(zhì)特征出發(fā)來看。我們知道風(fēng)控是放貸機(jī)構(gòu)自己的事情,而征信則是第三方機(jī)構(gòu)的信息服務(wù),后者是為前者的風(fēng)控服務(wù)的,對于信息的使用及其借款人對信息的知情權(quán)等方面,兩者是有根本性的區(qū)別的。所以我剛才講了,大數(shù)據(jù)技術(shù)開發(fā)的評分模型可以滿足準(zhǔn)確、穩(wěn)定的要求,但是在明確、可解釋性方面,尚待市場的檢驗。
放貸機(jī)構(gòu)為了風(fēng)控,可以竭盡所能地收集各類或真實的信息或待證實的噪音,且對借款人作的放貸決策也是完全基于自己的商業(yè)目的考慮。但是,征信機(jī)構(gòu)對信息的收集、加工和對外提供,則是完全按照市場和放貸機(jī)構(gòu)認(rèn)可、信息主體知情的方式進(jìn)行,征信機(jī)構(gòu)向放貸機(jī)構(gòu)提供的所有針對借款人個人的信息,如基礎(chǔ)性的信用報告,是基于基本客觀事實的匯總,經(jīng)得起借款人本人質(zhì)疑、挑戰(zhàn)的,信用報告的內(nèi)容、流程、流轉(zhuǎn)過程和使用判斷是受到監(jiān)管的。
此外,我知道美國的征信機(jī)構(gòu)一般是先提供了經(jīng)得起檢驗的信用報告,為信息主體本人提供信用報告查詢服務(wù)之后,再提供基于信用報告標(biāo)準(zhǔn)化解讀的各類信用評分服務(wù),我想也是有這樣一個明確性要求在里面。為了確保個人信息沒有被濫用,評分流程的基本方法、理念、結(jié)果是需要對外披露,并接受監(jiān)管部門的全程監(jiān)管的。特別是當(dāng)放貸機(jī)構(gòu)基于征信機(jī)構(gòu)的服務(wù)(如信用報告、個人信用評分),做出了不利于借款人的決策時,如拒絕借貸、提高費率、降低額度等,消費者是有知情權(quán)的。
王:非常贊成您的觀點,保護(hù)借款人(即信息主體)對征信系統(tǒng)本身及其本人信息被采集使用情況的知情,是征信行業(yè)的國際慣例,也是保證第三方征信機(jī)構(gòu)獨立、可信賴地位的基石。
鄂:是的。在大數(shù)據(jù)的背景下,各種可以預(yù)測違約的數(shù)據(jù)在豐富性、廣度和深度上出現(xiàn)了極大的增加,但是對大數(shù)據(jù)的使用不會也不應(yīng)該動搖剛才提到的征信與風(fēng)控間的基本框架。例如,一些大型互聯(lián)網(wǎng)公司,掌握了大量的個人互聯(lián)網(wǎng)行為信息,這些信息可以用于公司內(nèi)部的風(fēng)險管理和放貸決策,但是如果一旦用于第三方征信,則相關(guān)互聯(lián)網(wǎng)信息的使用和對外提供,必須經(jīng)受技術(shù)、用戶、法律、認(rèn)知等社會方方面面的考驗,滿足公平公正合法等基本要求。
王:但是我們目前這方面的法律規(guī)定還不太完善。
鄂:沒有法律規(guī)定也不一定是可以為之的,征信機(jī)構(gòu)的活動涉及消費者的切身利益,如果因為征信機(jī)構(gòu)的服務(wù),如提供了消費者不知情或認(rèn)為不準(zhǔn)確的信息,導(dǎo)致消費者的金融消費,如放貸、車貸等受阻,我認(rèn)為消費者也是有權(quán)告第三方征信機(jī)構(gòu)的。征信不是鬧著玩的,不建議目前部分機(jī)構(gòu)采取抱著試試看的態(tài)度,來看哪些數(shù)據(jù)和技術(shù)可用于風(fēng)險評估,并遞延到征信服務(wù)上,有些事情要事先考慮清楚。
王:在大數(shù)據(jù)時代,征信機(jī)構(gòu)利用大數(shù)據(jù)技術(shù)對借款人風(fēng)險水平的預(yù)測模型,如果經(jīng)過市場檢驗是有效的情況呢?
鄂:這是另一個問題,即便是對一群人的模型預(yù)測有效,但是用不成熟、不被大家接受的新技術(shù)和新方法,對個人進(jìn)行風(fēng)險預(yù)測并給個人的經(jīng)濟(jì)生活帶來影響,征信機(jī)構(gòu)也有被司法起訴的風(fēng)險,包括美國費埃哲(FICO)公司當(dāng)時也是這樣的,模型和技術(shù)要有可解釋性,符合社會公眾的可接受度,這樣才能站得住腳。從有效性角度來看,社交網(wǎng)絡(luò)信息對于營銷、對于反恐等被證明是有效的,但是對于征信的有效性,還是一個有待證明的另一個問題。
王:大數(shù)據(jù)在風(fēng)控運用上的一些創(chuàng)新確實存在,例如,傳統(tǒng)上主要是利用信用信息、財產(chǎn)信息來預(yù)測違約,目前依托信息和技術(shù)進(jìn)行了一些創(chuàng)新,如有機(jī)構(gòu)發(fā)現(xiàn)借款人手機(jī)的被叫時長、朋友圈的信息和違約有一定的關(guān)系,而將這些變量作為預(yù)測變量入模分析。
鄂:您說的可能是某個機(jī)構(gòu)根據(jù)某些信息得出的一個初步結(jié)論,可能會被常識支持,但是這僅僅是一些數(shù)據(jù)環(huán)境下的一個判斷,是否經(jīng)得起檢驗、站得住腳,我認(rèn)為還不能過早下結(jié)論。即便有效,我還是那個觀點,這個結(jié)論可以被放貸機(jī)構(gòu)的風(fēng)控所用,但是否可為征信機(jī)構(gòu)所用,還用待觀察。
王:就我們而言,征信系統(tǒng)一是收集放貸機(jī)構(gòu)等無論怎么努力也基本得不到的信息,如借款人在另一家放貸機(jī)構(gòu)的借款信息,之后供放貸機(jī)構(gòu)共享,二是收集放貸機(jī)構(gòu)等可以采集但是成本較高的信息,如法院判決信息,方法是統(tǒng)一采集、大家共用。征信系統(tǒng)提供的以上兩部分信息都是放貸機(jī)構(gòu)的外部信息一部分,放貸機(jī)構(gòu)風(fēng)控所使用的信息一定遠(yuǎn)遠(yuǎn)超過征信機(jī)構(gòu)提供的信息。
鄂:是的,征信機(jī)構(gòu)的信息永遠(yuǎn)是放貸機(jī)構(gòu)風(fēng)控的一個重要信息和工具的來源。其實,目前使用大數(shù)據(jù)模型中,我認(rèn)為很多變量是用來驗證信息的真?zhèn)蔚?,但是,預(yù)測違約率還是用傳統(tǒng)的信貸信息一些核心變量,目前來看,預(yù)測未來履約的信息范圍和方法論并沒有真正擴(kuò)大和突破。
王:非常感謝您的交流。
來源:中國征信
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
10#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新