頂級風控專家William Yao:美國銀行在人工智能應用上已經很成熟,國內仍停留在表面
【數據猿導讀】 姚博士對雷鋒網表示,美國的銀行利用機器學習等人工智能技術用得很深,用人工做決策的已經比較少,但是,國內卻停留在“talk-the-talk”層面,應用實踐更多是浮于表面,并直接指出國內很多金融機構的“大數據”并非大數據

在昨日由前海聯(lián)控、創(chuàng)大資本、前海夢工場聯(lián)合舉辦的前海國際科技創(chuàng)新峰會期間,全球個人信用風險評估體系的締造者,全球領先的預測分析和決策管理公司FICO的早期創(chuàng)始成員,前花旗銀行、匯豐銀行、陸金所等國際級金融機構首席風控官William Yao(姚志平)博士分享了“人工智能、金融科技在美國銀行的最佳實踐”。
姚博士對雷鋒網表示,美國的銀行利用機器學習等人工智能技術用得很深,用人工做決策的已經比較少,但是,國內卻停留在“talk-the-talk”層面,應用實踐更多是浮于表面,并直接指出國內很多金融機構的“大數據”并非大數據。
以下是姚博士的演講:
何謂大數據?一正一反的例子
今天我想跟大家分享一下美國的銀行,是如何用大數據和人工智能來產生實效的。美國的這些銀行啊,他在用大數據和人工智能方面,真的是用得很廣泛。他們用人工做決策的比較少,而且他做得很深。比如說花旗銀行,這銀行請了個很有名的物理學家——混沌理論的創(chuàng)始人,負責做模型。這個物理學家希望用他的理論來創(chuàng)造銀行的價值和增加預測的精準度。此外,銀行還請過地震學家,專門預測地震的,用地震的方法來預測一個人會好或是壞。還有用數學家、計算機學家,把世界各個行業(yè)的精英召集起來做預測。大家注意,這樣的機構不是科學院,而是個銀行啊。那么,關于大數據,我今天講兩個(案例),一個反面,一個正面。
大數據不是“多”,分析結果也要有群體效用
大數據是一個很俗的詞了,哪里都可以聽到大數據,但是很多人講的卻不是大數據。比如某個銀行,花了幾千萬人民幣,每天在找?guī)讉€億的數據。這就是大數據。扒完后,他就說看到上午某個人9點半在星巴克喝了咖啡,下面又去干嘛干嘛了,覺得厲害。其實這不是大數據,因為大數據不是找一個人,而是找一群人。這是一個例子。
此外,還有專門研究電信大數據的人。他們說,發(fā)現如果有人打電話進來,結果打完后時間很長的,這個人肯定打電話的是老板。呵呵。他覺得這就是大數據。
各位在坐很多是領導、老總。我建議啊,美國的老板是這么做的——他會問,
第一,“你說的這個事(這種特性)到底有多少人?”
第二,你找到了做這個事和不做這個事的人的分辨率和預測率是多少?
做領導的要問這些問題。
如果是20人左右不是大數據;如果說100萬人有這個行為,就是大數據了。
關于第二個問題,我舉個例子,銀行說找到了足夠的人來做這個事,不能找到幾個人。但除此之外,如果只找到他們去喝咖啡,也是沒用的。這不是大數據。
統(tǒng)計上要跟別人從本質上不一樣,必須滿足了這兩個條件才是有價值的大數據分析。
各位老板,以后你們的下屬跟你報告,你就這樣子問他——找到了多少人,做這個事和不做這個事的區(qū)別有多大?一定要這樣做,才會往前走。
方法太淺,數據價值發(fā)揮不出
20年前的信用卡積累到,肯定是大數據了。特別是信用卡的交易數據。比如,中國的銀行有1000萬的信用卡,很多了哈,假如銀行1000萬的信用卡,一個人做10條交易,一年就是12億的數據了。這個數據很巨大。
那么,金融的交易數據為何有用呢?今天的銀行很多做預測模型,都是總結好的數據來做預測,用1萬元來做預測。比如說賭博、買酒喝啊,去飯店吃飯、買書啊。信用卡交易可以做這些方面的預測。
當然了,光是這個也不叫大數據,因為太淺了。所以美國在幾十年前做這個東西就有套理論——他們認為,銀行的任務是了解客戶的狀態(tài)空間,所以要知道客戶的創(chuàng)造空間。銀行要去了解這個空間,要了解這個人。
但是,實際上任何一個國家,不可能了解每個人的所有狀態(tài)面,這是做不到的,也很難做到。于是有個人創(chuàng)造了這么個理論——這個理論是指,我應該是了解這個人的創(chuàng)造空間,知道他的XYZ,但跟真實的狀態(tài)空間并不關聯(lián)。這個理論有套東西可以證明——只要變量觀察得足夠長,就是XI+和XI+,就可以跟真的需要找的人的狀態(tài)空間有點重合。
我們講大數據啊,如果你光是用來做這些,這不是大數據,因為太簡單了。但是知道這個的人就已不多了。相信在坐也沒多少人知道這個理論,比如用一個變量的離散空間,構造出來的空間。反正按照目前的樣子,老板聽起來,就覺得這個東西是值錢的。
美國是怎么做呢?他是拿了千萬人的信用卡數據,我們試了3000多的變量,就找到了250個變量。我們分析這250個變量,“做這個事”和“不做這個事”有足夠的預測率,最后變成的模型。
所以,技術的核心是:
如何對這些變量進行構造?
人工智能:擅長于多因子分析
人工智能,美國銀行用得比較狹義,就是機器學習,用計算機來學習一樣東西,讓機器幫我們做更好的決策。
40年前,美國的MIT管理學院做了研究:盡管智商很高的人,人的大腦就是擅長于做單因子的分析。100萬人在我們面前,要識別出好的還是壞的,人很擅長做這樣的分析——學歷好和學歷低的風險、有房子和沒房子的人的風險(當然了,現在我們的房價高)、收入高和收入低的風險、女生和男生、年齡大和年齡小的風險的對比……這些都是人的單因子的分析。
但是如果我給你個問題,站在你面前是100人,都是男生,都是收入10萬元一年,都是一套房子,三張信用卡,什么情況都一樣,,這幾個變量都有了,你告訴我誰在將來12個月中的壞帳比例是多少?想象一下,在坐的各位任何人都無法回答這個問題,讓愛因斯坦來回答也回答不了。
人的大腦擅長做單因子的分析,不擅長于做綜合因子的判斷。誰擅長呢?誰擅長在幾十個、幾百個概念中做綜合判斷呢?計算機——只要給它數據,它都可以幫你計算出來。這是人工智能值得我們學習的東西。
“他們沒有感情偏差,能夠通過大量數據和權重計算出評分。”
美國幾乎各大銀行都在用機器學習做決策,這是機器學習一個很好的方面。各位如果有足夠的數據、大數據,去造一些預測模型,你做的決策會比人類做的決策精準度要高很多,結果要好。
來源:雷鋒網
刷新相關文章
我要評論
活動推薦more >
- 2018 上海國際大數據產業(yè)高2018-12-03
- 2018上海國際計算機網絡及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術峰會2018”2018-06-14