【案例】大型持牌消費(fèi)金融公司——智能風(fēng)控體系構(gòu)建
原創(chuàng) 氪信 | 2017-06-13 08:00
【數(shù)據(jù)猿導(dǎo)讀】 整個(gè)金融業(yè)態(tài)正在技術(shù)、資本和市場的共同作用下發(fā)生數(shù)字化重構(gòu)。面對劇烈變化的市場競爭格局和趨嚴(yán)的監(jiān)管政策,金融機(jī)構(gòu)紛紛通過引入先進(jìn)技術(shù)強(qiáng)化其核心競爭力,提升其原有體系的效率

本篇案例為數(shù)據(jù)猿推出的大型“金融大數(shù)據(jù)主題策劃”活動(dòng)(查看詳情)第一部分的系列案例/征文;感謝 氪信 的投遞
作為整體活動(dòng)的第二部分,2017年6月29日,由數(shù)據(jù)猿主辦,上海金融行業(yè)信息協(xié)會(huì)、互聯(lián)網(wǎng)普惠金融研究院聯(lián)合主辦,中國信息通信研究院、大數(shù)據(jù)發(fā)展促進(jìn)委員會(huì)、上海大數(shù)據(jù)聯(lián)盟、首席數(shù)據(jù)官聯(lián)盟、中國大數(shù)據(jù)技術(shù)與應(yīng)用聯(lián)盟協(xié)辦的《「數(shù)據(jù)猿·超聲波」之金融科技·商業(yè)價(jià)值探索高峰論壇》還將在上海隆重舉辦【論壇詳情丨上屆回顧】
在論壇現(xiàn)場,也將頒發(fā)“技術(shù)創(chuàng)新獎(jiǎng)”、“應(yīng)用創(chuàng)新獎(jiǎng)”、“最佳實(shí)踐獎(jiǎng)”、“優(yōu)秀案例獎(jiǎng)”四大類案例獎(jiǎng)
來源:數(shù)據(jù)猿丨投遞:氪信
當(dāng)下,普惠金融持續(xù)爆發(fā)式增長,2015年中國消費(fèi)信貸規(guī)模達(dá)到19萬億,同比增長23.3%,預(yù)計(jì)2019年將達(dá)到41.1萬億。
風(fēng)口背后,一方面是傳統(tǒng)金融未服務(wù)到的人群基數(shù)龐大,且長期缺乏金融產(chǎn)品,因此普惠金融產(chǎn)品是剛需,規(guī)模潛力巨大,滲透率低;另一方面,當(dāng)下智能手機(jī)普及,新交互方式極大提升信貸效率,且數(shù)據(jù)爆發(fā)時(shí)代使得海量數(shù)據(jù)獲取成本和難度大幅降低,在此之上運(yùn)用技術(shù)對龐大人群進(jìn)行定量風(fēng)險(xiǎn)分析和匹配金融服務(wù)不僅成為可能,而且規(guī)模效應(yīng)明顯。
因此,整個(gè)金融業(yè)態(tài)正在技術(shù)、資本和市場的共同作用下發(fā)生數(shù)字化重構(gòu)。面對劇烈變化的市場競爭格局和趨嚴(yán)的監(jiān)管政策,金融機(jī)構(gòu)紛紛通過引入先進(jìn)技術(shù)強(qiáng)化其核心競爭力,提升其原有體系的效率。
其中,尤為關(guān)鍵的是構(gòu)建其自動(dòng)化的數(shù)據(jù)能力,將專家的深厚經(jīng)驗(yàn)賦能機(jī)器,讓機(jī)器刻畫紛繁數(shù)據(jù)與目標(biāo)的復(fù)雜關(guān)系,以搶占消費(fèi)金融爆發(fā)窗口期。
氪信在此背景下,與多家大型領(lǐng)先的金融機(jī)構(gòu)深入探索人工智能在消費(fèi)金融領(lǐng)域的成熟應(yīng)用,針對客戶核心需求已形成包括數(shù)據(jù)、模型、引擎在內(nèi)的一整套完整解決方案。
周期/節(jié)奏
項(xiàng)目于16年10月開始,17年2月結(jié)束。
客戶名稱/所屬分類
大型持牌消費(fèi)金融公司·風(fēng)控
任務(wù)/目標(biāo)
由于新金融業(yè)務(wù)的迅速普惠化,金融客戶也面臨著嶄新的挑戰(zhàn)和需求。
一方面由于客群下沉,可獲得的用戶信息愈發(fā)受限,數(shù)據(jù)質(zhì)量參差不齊,傳統(tǒng)風(fēng)控經(jīng)驗(yàn)無法直接應(yīng)用,急需利用先進(jìn)技術(shù)來提升風(fēng)控能力;
另一方面互聯(lián)網(wǎng)金融往往小額量大,基于人工的風(fēng)控成本過高,用自動(dòng)化的數(shù)據(jù)智能風(fēng)控體系來提升整個(gè)流程的效率也是必然的發(fā)展趨勢。
因此,如何在線上信用貸場景搭建一整套從數(shù)據(jù)到算法到平臺(tái)的數(shù)據(jù)架構(gòu)體系,并在風(fēng)控反欺詐和授信業(yè)務(wù)中得到具體的落地應(yīng)用是本次案例的最終目標(biāo)。
挑戰(zhàn)
從業(yè)務(wù)實(shí)施落地的角度看,客戶面臨的挑戰(zhàn)主要可以分為三個(gè)方面,分別是“數(shù)據(jù)”、“怎么用”和“跑起來”的問題。
首先,針對第一個(gè)“數(shù)據(jù)”挑戰(zhàn),本質(zhì)是該用哪些數(shù)據(jù)的問題,現(xiàn)在金融場景可用的數(shù)據(jù)早已遠(yuǎn)遠(yuǎn)超出傳統(tǒng)強(qiáng)征信數(shù)據(jù)的范疇,我們可以看到辟如互聯(lián)網(wǎng)行為、電商、社交、運(yùn)營商等廣泛的大數(shù)據(jù)都在金融領(lǐng)域內(nèi)嶄露頭角,但結(jié)合到客戶不同業(yè)務(wù)和場景,哪些場景該用哪些數(shù)據(jù)?不同數(shù)據(jù)在其中的價(jià)值又有幾何?具體能夠表征哪些維度的風(fēng)險(xiǎn)?
這些都需要大量摸索的實(shí)踐,僅靠金融經(jīng)驗(yàn),或者技術(shù)本身,任何一個(gè)都無法單獨(dú)解答這些問題。而這個(gè)問題的答案恰恰很多時(shí)候就直接決定了業(yè)務(wù)的成本和收益。
其次,針對“怎么用”問題,這確實(shí)是當(dāng)下技術(shù)給我們帶來提升最大的點(diǎn),也是最痛的點(diǎn)。事實(shí)上,由于數(shù)據(jù)的不同,這相當(dāng)于重構(gòu)一套與傳統(tǒng)風(fēng)控體系并行的數(shù)據(jù)架構(gòu)體系。
在這過程中,如何將海量稀疏、超高維、低飽和的大數(shù)據(jù)與風(fēng)險(xiǎn)掛鉤?如何挖掘非結(jié)構(gòu)化數(shù)據(jù)價(jià)值時(shí)窮盡風(fēng)險(xiǎn)?如何最大化技術(shù)和現(xiàn)有業(yè)務(wù)的結(jié)合深度?即使在當(dāng)下深度學(xué)習(xí)、硬件框架取得突破性發(fā)展的今天,真正落地為金融風(fēng)控體系的工業(yè)應(yīng)用,轉(zhuǎn)化為巨大的商業(yè)價(jià)值,我們都還有較大的鴻溝需要趟過去。
把難點(diǎn)分解,可以看到需要三個(gè)因素的合力作用,包括成熟的機(jī)器學(xué)習(xí)技術(shù)、深厚的金融領(lǐng)域知識(shí)以及支持機(jī)器學(xué)習(xí)建模的平臺(tái),缺一不可,而對金融機(jī)構(gòu)來說,這一整套在大數(shù)據(jù)生態(tài)體系上的經(jīng)驗(yàn)尚不豐富。
第三,針對“跑起來”的問題,試想,我們有了清晰的數(shù)據(jù)認(rèn)知,結(jié)合不同場景和風(fēng)控業(yè)務(wù)我們也摸索了一套經(jīng)驗(yàn)證的數(shù)據(jù)使用方式,但如何與我們的業(yè)務(wù)系統(tǒng)對接,成為實(shí)時(shí)的數(shù)據(jù)服務(wù)?這還需要一整套支持機(jī)器學(xué)習(xí)特征、模型計(jì)算的引擎。這其中也涉及很多方面的考慮,包括系統(tǒng)架構(gòu)、操作管理、可靠性、可擴(kuò)展性、運(yùn)維監(jiān)控以及模型自迭代等等。
最終,如何實(shí)現(xiàn)從數(shù)據(jù)、特征到規(guī)則、模型持續(xù)優(yōu)化的閉環(huán)系統(tǒng)?如何平衡靈活性和功能性以保證業(yè)務(wù)能夠快速落地并取得實(shí)際的效果提升?這其實(shí)也超出了傳統(tǒng)風(fēng)控引擎的能力范圍。
實(shí)施過程/解決方案
上述三個(gè)方面的挑戰(zhàn)貫穿風(fēng)控的各條業(yè)務(wù)線,此次案例的解決方案著眼于風(fēng)控核心的反欺詐和授信兩個(gè)階段來闡述如何解決這幾個(gè)問題,并構(gòu)建一整套完整的申請貸前風(fēng)控體系。
反欺詐
首先是反欺詐,現(xiàn)在線上欺詐風(fēng)險(xiǎn)變化非常頻繁,以往單一的個(gè)體欺詐已迅速演變成有組織、有規(guī)模的團(tuán)體欺詐和相應(yīng)的關(guān)聯(lián)風(fēng)險(xiǎn)。
傳統(tǒng)反欺詐手段包括驗(yàn)真、客戶信息邏輯校驗(yàn)、外部信息對比校驗(yàn)、灰黑名單過濾等方式主體還是在識(shí)別個(gè)人風(fēng)險(xiǎn),無法根據(jù)千絲萬縷的關(guān)系挖掘潛在的群體欺詐,這需要基于網(wǎng)絡(luò)的全局風(fēng)險(xiǎn)識(shí)別能力來覆蓋風(fēng)險(xiǎn)漏洞。
氪信一方面針對機(jī)構(gòu)的存量數(shù)據(jù),利用辟如申請資料、運(yùn)營商等數(shù)據(jù)構(gòu)建復(fù)雜網(wǎng)絡(luò),如圖所示,每一個(gè)申請人、id、手機(jī)號(hào)、設(shè)備、地址等都是網(wǎng)絡(luò)中的實(shí)體,而諸如申請人擁有設(shè)備、手機(jī)號(hào)呼叫手機(jī)號(hào)等有向聯(lián)系就是圖中的邊,邊的權(quán)重為關(guān)系的緊密程度。
另一方面氪信采用先進(jìn)的動(dòng)態(tài)社區(qū)挖掘算法(如LouvainCommunityDetection)實(shí)現(xiàn)風(fēng)險(xiǎn)分團(tuán),并利用無監(jiān)督PageRank算法等計(jì)算相應(yīng)的全局風(fēng)險(xiǎn)特征和局部風(fēng)險(xiǎn)特征,在此之上訓(xùn)練基于有監(jiān)督算法的集成機(jī)器學(xué)習(xí)模型。
事實(shí)上,這不僅在方法論層面有所突破,相對以往基于有限維度的網(wǎng)絡(luò)和規(guī)則模型,在最終識(shí)別效果上也有較大的提升。
另外,在系統(tǒng)層面,整個(gè)體系的“跑起來”和持續(xù)優(yōu)化非常重要。氪信一方面提供圖挖掘查詢引擎,支持實(shí)時(shí)的查詢相應(yīng),實(shí)時(shí)的網(wǎng)絡(luò)關(guān)系更新,并輸出查詢實(shí)體的風(fēng)險(xiǎn)等級(jí)、解釋以及風(fēng)險(xiǎn)關(guān)系網(wǎng)絡(luò)展示;另一方面氪信也引入主動(dòng)式預(yù)警和人工研判機(jī)制,將模型結(jié)果和專家經(jīng)驗(yàn)實(shí)時(shí)地反饋到網(wǎng)絡(luò)反欺詐產(chǎn)品,使得模型不僅能夠甄別事實(shí),更應(yīng)該是學(xué)習(xí)到專家認(rèn)定為欺詐的經(jīng)驗(yàn),從而真正形成完整的數(shù)據(jù)和模型優(yōu)化閉環(huán)。
授信建模
第二塊合作是授信建模,由于線上信用貸的產(chǎn)品形態(tài)決定了整個(gè)客群相對次級(jí),大部分為央行白戶,因此機(jī)構(gòu)能夠獲取到的數(shù)據(jù)非常有限,往往僅限于APP、運(yùn)營商、場景數(shù)據(jù)及少量驗(yàn)真事實(shí)類數(shù)據(jù)等,本質(zhì)上這個(gè)業(yè)務(wù)的建模就是基于弱數(shù)據(jù)的風(fēng)險(xiǎn)建模過程,氪信基于金融場景沉淀形成的金融知識(shí)圖譜,提供一系列從數(shù)據(jù)到特征到模型的全維知識(shí)體系。
建模的第一步是特征工程,眾所周知,特征是機(jī)器學(xué)習(xí)建模的原材料,對最終模型的影響至關(guān)重要。特征加工和衍生工作越完備,那么構(gòu)建的機(jī)器學(xué)習(xí)模型效果越好。但是,面對不同數(shù)據(jù),不同業(yè)務(wù)場景,特征加工衍生往往是最耗時(shí)間與資源的工作。
尤其在弱數(shù)據(jù)方面,充斥著大量文本、時(shí)序類數(shù)據(jù),人工特征定義的方法天然存在較大局限性。辟如在文本上,專家可根據(jù)豐富的經(jīng)驗(yàn)計(jì)算相應(yīng)的統(tǒng)計(jì)量、tf-idf指標(biāo)等等來提取特征捕捉一些敏感詞等,但不可置否的是,由于線上風(fēng)險(xiǎn)的演化頻繁,專家總有無法抓到的新黑產(chǎn)術(shù)語,這帶來了風(fēng)險(xiǎn)上無法窮盡的難題。
氪信引入基于深度學(xué)習(xí)的特征提取框架,使用不同的深度學(xué)習(xí)模型來擬合不同的數(shù)據(jù)類型,自動(dòng)從大量龐雜的非結(jié)構(gòu)化數(shù)據(jù)中生成高質(zhì)量的深度學(xué)習(xí)特征。
如下圖,通過將諸如文本等數(shù)據(jù)轉(zhuǎn)化為向量,用深度學(xué)習(xí)提取向量空間中的關(guān)系可自動(dòng)生成抽象的特征表征,進(jìn)一步我們就能計(jì)算語義相似性,并運(yùn)用分類器網(wǎng)絡(luò)實(shí)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)與金融風(fēng)險(xiǎn)的深度掛鉤。
事實(shí)上,深度學(xué)習(xí)在這塊的價(jià)值是在于對金融專家經(jīng)驗(yàn)體系的補(bǔ)充,在處理人工難以固化為特定風(fēng)險(xiǎn)知識(shí)或規(guī)則的基礎(chǔ)上予以最大彌補(bǔ)。另外,比較意外的是,機(jī)器生成的特征在模型效果最后的提升已顯現(xiàn)出較大的提升,也驗(yàn)證了深度學(xué)習(xí)對于挖掘深層時(shí)序關(guān)系,文本內(nèi)容深層含義在超越人工定義深度方面的價(jià)值。
具體模型方面,我們知道在基于弱數(shù)據(jù)的特征加工和衍生后,機(jī)構(gòu)往往會(huì)面臨非常多的特征維度,少則幾千,多則上萬,且非常稀疏、低飽和。這遠(yuǎn)遠(yuǎn)超出傳統(tǒng)風(fēng)控基于評分卡體系的建模能力范圍。
氪信引入復(fù)雜集成模型來解決這一問題,集成模型從“voting”的思想去簡單理解,就是針對不同類型的數(shù)據(jù)我們選用最合適的子模型來處理,然后每個(gè)子模型投票做出決策。
相對單一模型有限的預(yù)測能力,“好而不同”的模型集成效果明顯會(huì)卓越很多,此外無論從穩(wěn)定度、容錯(cuò)、還是抗擾動(dòng)能力來講,集成模型也都在性能和泛化能力之間取得了極好的平衡。
復(fù)雜集成模型框架除了在當(dāng)前場景和業(yè)務(wù)的建模中有較好的表現(xiàn),它的另一個(gè)重要價(jià)值還在于領(lǐng)域適配方面的能力,任何一個(gè)單獨(dú)領(lǐng)域子模型都可以快速遷移應(yīng)用到新的業(yè)務(wù)應(yīng)用上,對機(jī)構(gòu)在戰(zhàn)略層面實(shí)現(xiàn)場景間的遷移和業(yè)務(wù)冷啟動(dòng)階段都可以發(fā)揮極其重要的作用。
系統(tǒng)層面,為了能夠支持整個(gè)機(jī)器學(xué)習(xí)模型體系“跑起來”的所有功能,氪信也落地了一整套基于大規(guī)模機(jī)器學(xué)習(xí)框架在線執(zhí)行引擎,從數(shù)據(jù)接入、加工處理、得出結(jié)果再到監(jiān)控自迭代,整個(gè)都是自動(dòng)化的過程?,F(xiàn)在線上信用貸的業(yè)務(wù)量增長非??欤刂骑L(fēng)險(xiǎn)、解放人力已成為最緊迫的需求之一,這也是這套數(shù)據(jù)智能一體化引擎的核心價(jià)值所在。
結(jié)果/效果總結(jié)
最后,在整個(gè)線上信用貸場景實(shí)踐下來,經(jīng)過跨多個(gè)時(shí)間段多批次的驗(yàn)證,可以看到,效果上還是有非常直接的提升。僅基于有限的弱數(shù)據(jù),模型層面,性能相比傳統(tǒng)模型提升了大約70%,最大ks值始終穩(wěn)定在0.3以上,風(fēng)控維度也從之前的數(shù)十維擴(kuò)展至2600多維;業(yè)務(wù)層面,經(jīng)測算,壞賬率也有46%的直接下降。
企業(yè)介紹:
氪信CreditX是一家獨(dú)立的第三方金融人工智能公司,致力于在金融風(fēng)險(xiǎn)領(lǐng)域運(yùn)用高維數(shù)據(jù)處理和機(jī)器學(xué)習(xí)技術(shù),為企業(yè)和金融機(jī)構(gòu)提供場景化的風(fēng)控解決方案和產(chǎn)品體系。
氪信提供一整套基于大規(guī)模機(jī)器學(xué)習(xí)框架的自動(dòng)化風(fēng)控引擎和數(shù)據(jù)風(fēng)險(xiǎn)服務(wù),旨在風(fēng)控業(yè)務(wù)的整個(gè)工作階段提供完整的功能服務(wù)。前者包括先進(jìn)的建模平臺(tái)和在線執(zhí)行引擎,解決不同場景下的風(fēng)控智能化問題;后者基于氪信圖譜,利用復(fù)雜集成建模技術(shù)輸出場景化的數(shù)據(jù)風(fēng)險(xiǎn)服務(wù)。
氪信成立于2015年,創(chuàng)始團(tuán)隊(duì)均是來自微軟、雅虎、eBay、PayPal、阿里巴巴、華為、攜程、央行核心業(yè)務(wù)的頂尖菁英。創(chuàng)始人朱明杰畢業(yè)于中科大少年班系,是中科大和微軟亞洲研究院聯(lián)合培養(yǎng)博士和德國馬克思普朗克研究所博士后。曾師從德國馬克思普朗克研究所計(jì)算機(jī)科學(xué)研究所所長,ACM/IEEEfellow國際大規(guī)模數(shù)據(jù)庫協(xié)會(huì)(VLDB)主席GerhardWeikum教授,合作大規(guī)模語義圖挖掘,領(lǐng)導(dǎo)歐盟進(jìn)化知識(shí)計(jì)算項(xiàng)目。在雅虎研究院從事搜索科學(xué),支撐雅虎搜索和廣告的機(jī)器學(xué)習(xí)排序、用戶意圖理解以及個(gè)性化系統(tǒng)。在eBay擔(dān)任搜索科學(xué)高級(jí)數(shù)據(jù)科學(xué)家。后加入攜程,擔(dān)任數(shù)據(jù)總監(jiān),從無到有的組建攜程大數(shù)據(jù)部門,負(fù)責(zé)攜程的基礎(chǔ)數(shù)據(jù)平臺(tái)和機(jī)器學(xué)習(xí)人工智能的應(yīng)用。
短短一年,氪信產(chǎn)品體系已服務(wù)于消費(fèi)分期、小微金融、現(xiàn)金貸、信用卡、供應(yīng)鏈等數(shù)十個(gè)垂直場景,且驗(yàn)證效果顯著,合作客戶遍歷中國民生銀行、招商銀行、中國平安、中銀消費(fèi)金融、招聯(lián)消費(fèi)金融、眾安保險(xiǎn)、點(diǎn)融網(wǎng)等頂尖機(jī)構(gòu)和持牌消費(fèi)金融公司。
短時(shí)間內(nèi)實(shí)現(xiàn)技術(shù)在金融領(lǐng)域的巨大價(jià)值轉(zhuǎn)化也使氪信屢獲資本市場青睞,截至目前,氪信已完成招商局創(chuàng)投領(lǐng)投、美國中經(jīng)合集團(tuán)共同投資的B輪融資,前兩輪投資方火山石資本、真格基金也對本輪融資投資加碼。
歡迎更多大數(shù)據(jù)企業(yè)、大數(shù)據(jù)愛好者投稿數(shù)據(jù)猿,來稿請直接投遞至:tougao@datayuan.cn
來源:數(shù)據(jù)猿
刷新相關(guān)文章
我要評論
活動(dòng)推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國際峰會(huì)2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
10#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新