細(xì)數(shù):美國(guó)金融大數(shù)據(jù)建模的“成王敗寇”
【數(shù)據(jù)猿導(dǎo)讀】 金融行業(yè)都在經(jīng)歷著高難度的轉(zhuǎn)型,轉(zhuǎn)型中有痛,也有坑。在參考成功案例的同時(shí),也有必要借鑒失敗的經(jīng)驗(yàn)

金融行業(yè)都在經(jīng)歷著高難度的轉(zhuǎn)型,轉(zhuǎn)型中有痛,也有坑。在參考成功案例的同時(shí),也有必要借鑒失敗的經(jīng)驗(yàn)。
第一個(gè)例子是Capital One精準(zhǔn)營(yíng)銷(xiāo)的項(xiàng)目,這個(gè)案例曾被華爾街報(bào)道并被很多公司模仿。
公司業(yè)務(wù)總是要求不斷增長(zhǎng),但銷(xiāo)售或者市場(chǎng)總有遇到瓶頸之時(shí),大數(shù)據(jù)技術(shù)到底能不能有效地將客戶(hù)引導(dǎo)到你的平臺(tái)上來(lái)?
首先,Capital One要做的是,如何利用各種數(shù)據(jù)讓客戶(hù)來(lái)了之后快速地在30秒之內(nèi)匹配合適的信用卡。不同人群的上網(wǎng)時(shí)間、方式不一樣,因此,就需要利用客戶(hù)的瀏覽行為來(lái)進(jìn)行判斷。
第二,通過(guò)上網(wǎng)的信息(比如說(shuō)IP地址)迅速定位到客戶(hù)的地點(diǎn),這個(gè)地址可以幫助我們很快地匹配人口統(tǒng)計(jì)數(shù)據(jù)。當(dāng)時(shí)美國(guó)剛剛經(jīng)歷了金融危機(jī),房貸的壞賬率是和位置數(shù)據(jù)非常相關(guān)的,通過(guò)位置信息就可以判斷房?jī)r(jià)等因素。
同時(shí)匹配這個(gè)人是否為銀行已有的客戶(hù),歷史交易狀況如何?將這些數(shù)據(jù)輸入到一個(gè)模型里面,形成一個(gè)引擎,在十秒之內(nèi)就能清楚地匹配到很準(zhǔn)確的產(chǎn)品,可以將銀行收益比例提高30%。
第二個(gè)例子是反欺詐問(wèn)題。
電信欺詐、金融欺詐是非常嚴(yán)重的問(wèn)題,目前國(guó)內(nèi)從政府到各個(gè)層面已經(jīng)逐漸提高防欺詐意識(shí),同時(shí)也意味著很多領(lǐng)域都要做大量防欺詐工作。
那么,怎樣快速鑒定欺詐的人群和交易行為?這需要很多的數(shù)據(jù)支撐。
一個(gè)是交易數(shù)據(jù),包括海量交易數(shù)據(jù)、附近商戶(hù)數(shù)據(jù)、社交鏈行為數(shù)據(jù),比如刷卡行為發(fā)生的時(shí)間、交易特征、刷卡商戶(hù)附近居住的人群社交量的數(shù)據(jù),以及與刷卡商戶(hù)平時(shí)發(fā)生交易的特定客戶(hù)的行為特征。不過(guò)這個(gè)反欺詐是不完全準(zhǔn)確的,總會(huì)有一些漏網(wǎng)之魚(yú),也總會(huì)因?yàn)?ldquo;假陽(yáng)性”造成不好的用戶(hù)體驗(yàn),這就需要利用多維度數(shù)據(jù)反復(fù)驗(yàn)證、比較、不斷優(yōu)化。
二是建立數(shù)據(jù)模型,通過(guò)機(jī)器學(xué)習(xí)技術(shù),不斷加入新緯度的數(shù)據(jù)來(lái)提高模型的準(zhǔn)確性,目前已經(jīng)阻止78%的欺詐行為。但高科技犯罪的人是道高一尺魔高一丈,還要防止他們建立模型進(jìn)行破壞。
再來(lái)看看失敗的案例:
第一個(gè)失敗案例是谷歌的,其科學(xué)家團(tuán)隊(duì)開(kāi)發(fā)的預(yù)測(cè)美國(guó)流感發(fā)生趨勢(shì)的大數(shù)據(jù)模型,想要根據(jù)谷歌五年的歷史搜索數(shù)據(jù)里面的關(guān)健詞,預(yù)測(cè)美國(guó)流感從什么地方傳播到什么地方。
為什么會(huì)失敗呢?
一是,搜索的人并不知道流感和普通感冒的區(qū)別,不一定是得流感的人在搜索,也可能是頭疼,而這個(gè)模型將此進(jìn)行了過(guò)度關(guān)聯(lián)。
另外一個(gè)原因是恐慌因素,比如旁邊一個(gè)州的人發(fā)生了流感,另外一個(gè)州的人要做準(zhǔn)備,谷歌誤認(rèn)為這個(gè)流感已經(jīng)到這里了,同樣是過(guò)度關(guān)聯(lián)的結(jié)果。
在美國(guó)有幾個(gè)互聯(lián)網(wǎng)金融公司專(zhuān)做中小企業(yè)貸款。但是中小企業(yè)貸款涉及的數(shù)據(jù)更復(fù)雜,而且中小企業(yè)涉及到整個(gè)行業(yè)非常特殊的一些數(shù)據(jù),比如非標(biāo)準(zhǔn)的財(cái)務(wù)報(bào)表和不同行業(yè)、不同范式的合同,他們沒(méi)有很專(zhuān)業(yè)的知識(shí),是很難理解或者很難有時(shí)間把它準(zhǔn)確挖掘出來(lái)。
當(dāng)時(shí)想用一個(gè)很完美的模型把所有的問(wèn)題都解決掉,比如把市場(chǎng)和信貸的解決方案全部用一個(gè)模型來(lái)解決,但因?yàn)閿?shù)據(jù)的復(fù)雜程度,最后證明這種方法是失敗的,而且90%的時(shí)間都在做數(shù)據(jù)清理。
這就說(shuō)明,想通過(guò)大數(shù)據(jù)技術(shù)一下子解決所有的問(wèn)題是很難成功的,而是要用抽絲剝繭、循序漸進(jìn)的方式。
美國(guó)經(jīng)驗(yàn)?zāi)芙o我們帶來(lái)哪些啟示?
1.大數(shù)據(jù)是一種技術(shù),但首先是一種思維。
如何在日常商業(yè)運(yùn)作中,把大數(shù)據(jù)作為出發(fā)點(diǎn),而不是當(dāng)成技術(shù)來(lái)考慮,是非常重要的思維轉(zhuǎn)變。
2. 加強(qiáng)基礎(chǔ)建設(shè),尤其是數(shù)據(jù)采集體系。
項(xiàng)目要從一開(kāi)始就要提前規(guī)劃,而不是進(jìn)行到一定程度再找數(shù)據(jù)。
3. 可視化,可視化,可視化。重要的事情說(shuō)三遍。
如果數(shù)據(jù)不能讓你的決策層充分或者非常簡(jiǎn)明的看出它的重要性,尤其是對(duì)決策的重要性,基本上就是沒(méi)有用處的。因此,不管數(shù)據(jù)有多大,顯現(xiàn)出來(lái)的效果一定要簡(jiǎn)潔明了。
4. 小步走,不停地試錯(cuò)。
通過(guò)上文的失敗案例,得到的教訓(xùn)就是“如果你想把所有的事情一下做好反而不會(huì)成功”。要通過(guò)明顯的階段性的大數(shù)據(jù)成果帶來(lái)直接效益,讓公司決策層增強(qiáng)信心,這樣會(huì)讓客戶(hù)的感受度更好。
5. 不斷學(xué)習(xí),切忌跟風(fēng)。
技術(shù)發(fā)展速度快得讓人覺(jué)得三天不學(xué)習(xí)就落伍了,這也是很困擾大家的事情。怎么辦?
在實(shí)踐中,可以關(guān)注和追蹤新技術(shù)的發(fā)展,但不要一味地跟風(fēng)和模仿。如果發(fā)現(xiàn)對(duì)你有用的方法可以先拿過(guò)來(lái)做出一定的成績(jī),在充分掌握現(xiàn)有信息的基礎(chǔ)上,再學(xué)習(xí)和加強(qiáng)對(duì)新技術(shù)的認(rèn)知。
來(lái)源:九次方大數(shù)據(jù)
刷新相關(guān)文章
我要評(píng)論
人物專(zhuān)訪more >
活動(dòng)推薦more >
- 2018 上海國(guó)際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國(guó)際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國(guó)國(guó)際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)2018-06-21
- “無(wú)界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過(guò)的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車(chē)
-
4數(shù)據(jù)智能 無(wú)限未來(lái)—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
10#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新