金融行業(yè)采用大數(shù)據(jù)面臨的挑戰(zhàn)和科技發(fā)展的未來機(jī)會(huì)
【數(shù)據(jù)猿導(dǎo)讀】 從大數(shù)據(jù)的視角來看,金融行業(yè)更有意思的地方在于,新的規(guī)范和匯報(bào)標(biāo)準(zhǔn)形成的持續(xù)流動(dòng)為金融系統(tǒng)提供了新的數(shù)據(jù)源和更加復(fù)雜的維度。這使得金融行業(yè)成為數(shù)據(jù)科學(xué)家施展拳腳的地方

在說起高科技驅(qū)動(dòng)的行業(yè)時(shí),人們——至少有不少人——首先想到的肯定不是銀行業(yè)。然而,當(dāng)我們考慮大數(shù)據(jù)的 3V 特性[1]——Volume、Velocity 和 Variety——時(shí),很難有其他行業(yè)能夠比金融行業(yè)更加貼近這些特性。例如,僅 2016 年 4 月一個(gè)月,外匯(ForEX)市場(chǎng)每天平均交易額為 1.5 萬億美元[2]。外匯市場(chǎng)提供了世界各國(guó)貨幣之間的實(shí)時(shí)匯率,促進(jìn)了全球貿(mào)易和結(jié)算。
在本文中,我會(huì)討論大數(shù)據(jù)方法與金融行業(yè)的相關(guān)性,描繪出金融行業(yè)采用大數(shù)據(jù)面臨的挑戰(zhàn)和科技發(fā)展的未來機(jī)會(huì)。盡管很多應(yīng)用領(lǐng)域都與消費(fèi)金融相關(guān),由于金融行業(yè)的交易體量和資金體量的緣故,本文集中在企業(yè)銀行方面(金融市場(chǎng)、企業(yè)信貸、交易等)。
金融行業(yè)大數(shù)據(jù)
我們先檢驗(yàn)一下大數(shù)據(jù)的 3V 特性與金融的關(guān)聯(lián):
Volume:TB 甚至 PB 的數(shù)據(jù)才被認(rèn)為達(dá)到大數(shù)據(jù)級(jí)別。金融行業(yè)產(chǎn)生了大量的報(bào)價(jià)、市場(chǎng)數(shù)據(jù)和歷史交易數(shù)據(jù)。單是紐交所一天就會(huì)寫入超過 1 TB 的數(shù)據(jù)[3]。
Velocity:數(shù)據(jù)存儲(chǔ)或者處理速度達(dá)到每秒 100000 次以上才認(rèn)為符合大數(shù)據(jù)標(biāo)準(zhǔn)。 對(duì)于金融市場(chǎng)而言,如此高速的產(chǎn)生數(shù)據(jù)不算什么難事。而且,系統(tǒng)處理交易數(shù)據(jù)的速度越快,他們交易的速度就越快。
Variety:這要求大數(shù)據(jù)算法能夠處理不同的數(shù)據(jù)格式和數(shù)據(jù)源。在企業(yè)銀行中,機(jī)構(gòu)要同時(shí)處理參考數(shù)據(jù)(比如法人實(shí)體)、交易和市場(chǎng)數(shù)據(jù)、客戶要求(通過電子或者聲音的形式提出)以及其他很多數(shù)據(jù)源。
從大數(shù)據(jù)的視角來看,金融行業(yè)更有意思的地方在于,新的規(guī)范和匯報(bào)標(biāo)準(zhǔn)形成的持續(xù)流動(dòng)為金融系統(tǒng)提供了新的數(shù)據(jù)源和更加復(fù)雜的維度。
這使得金融行業(yè)成為數(shù)據(jù)科學(xué)家施展拳腳的地方。
除去周末的短暫時(shí)間窗口,前文提到的外匯市場(chǎng)全天 24 小時(shí)交易,從澳大利亞悉尼的早晨到美國(guó)紐約的夜晚。另外,算法交易已經(jīng)在金融市場(chǎng)以各種形式存在了很長(zhǎng)時(shí)間。紐交所在 20 世紀(jì) 70 年代初期引入了其指定的訂單周轉(zhuǎn)(DOT)系統(tǒng),用于將訂單周轉(zhuǎn)到交易操作臺(tái),此前這些都是手動(dòng)執(zhí)行的?,F(xiàn)在,算法交易系統(tǒng)將很大的訂單拆分為較小的訂單,并基于時(shí)間、價(jià)格和體量自動(dòng)執(zhí)行交易,市場(chǎng)參數(shù)得以優(yōu)化。
在連續(xù)的基礎(chǔ)上,大量數(shù)據(jù)的處理被用于金融機(jī)構(gòu)的報(bào)告。
銀行和金融市場(chǎng)規(guī)范越來越頻繁地要求計(jì)算復(fù)雜的度量指標(biāo),如 XVA(基于交易對(duì)手信用風(fēng)險(xiǎn)、融資成本、保證金等對(duì)衍生工具的估值調(diào)整)。這些指標(biāo)被用于設(shè)定銀行的最低資金保留額度,而后者直接影響銀行利潤(rùn)率。
分析時(shí)序交易數(shù)據(jù),對(duì)市場(chǎng)和用戶行為建模。例如,繪制交易量隨時(shí)間的變化圖有助于預(yù)測(cè)信用違約的可能性,為銀行節(jié)省貸款資源。
一些大型金融機(jī)構(gòu)在采用大數(shù)據(jù)方面步履緩慢,但是普華永道的市場(chǎng)研究澄清了這些機(jī)構(gòu)中的組織文化方面的阻礙因素[4],其中很多方面在其他行業(yè)也都是相關(guān)的。首先,一些金融行業(yè)管理者認(rèn)為,大數(shù)據(jù)只能解決技術(shù)問題而不能解決業(yè)務(wù)問題。然而,數(shù)據(jù)是由業(yè)務(wù)產(chǎn)生的、數(shù)據(jù)結(jié)果用在業(yè)務(wù)上,很明顯技術(shù)是支持業(yè)務(wù)的。一些人不理解如何從數(shù)據(jù)流中獲得價(jià)值,而另一些覺得大數(shù)據(jù)方法可以提升技術(shù)效率但是對(duì)于盈虧底線用處不大。然而,大數(shù)據(jù)方法可以提供的深度分析能夠直接支持業(yè)務(wù)增長(zhǎng)并提升效率。金融行業(yè)從來不是數(shù)據(jù)科學(xué)家的心之所往,所以一些金融機(jī)構(gòu)在為自身尋找和吸引技能型人才方面困難重重。最終,即使是金融機(jī)構(gòu)具備變革意愿,但他們并不清楚要讓企業(yè)轉(zhuǎn)型利用大數(shù)據(jù)方法應(yīng)該如何開始、從何處開始。
然而,根據(jù)最近 IDC[5]的研究,銀行業(yè)位于行業(yè)投資大數(shù)據(jù)研究排行榜前列,如圖 1 所示。并且,金融科技公司,或者 FinTech 公司,正在為銀行在資產(chǎn)和財(cái)富管理方面的大量需求開發(fā)解決方案和產(chǎn)品;圖 2 給出了基于普華永道報(bào)告[6]的各領(lǐng)域 FinTech 公司的比例。追隨這一趨勢(shì),圍繞著金融數(shù)據(jù)提高業(yè)務(wù)效率的其他應(yīng)用,研究和算法也有很大進(jìn)展。我們接下來重點(diǎn)介紹其中幾個(gè)。
圖 1. 2016 年大數(shù)據(jù)分析市場(chǎng)(1310 億美元)(Original data from IDC5)
圖 2. 不同領(lǐng)域 FinTech 公司的大致比例 (Original data from PwC6)
市場(chǎng)交易模式
市場(chǎng)交易模式的自適應(yīng)模型可以為買賣特定類似資產(chǎn)的投資策略提供輸入。本節(jié)展示一個(gè)例子。
除息日(也稱為 X-Day)是存托憑證(DR)的賣方有權(quán)獲得最后一次派息的第一個(gè)交易日。在除息日之前,DR 的買方將獲得分紅。美國(guó) DRs(即ADRs)是由非美國(guó)公司在美國(guó)市場(chǎng)交易的金融工具。因此,股息存在雙重征稅負(fù)擔(dān):美國(guó)的稅收和發(fā)行 ADR 的國(guó)家的扣繳稅款。其結(jié)果是,投資者有動(dòng)力在除息日之前賣出 ADRs,并在除息日之后買入。當(dāng)然,稅收政策對(duì) ADR 市場(chǎng)的穩(wěn)定性有很大的影響。
在最近的研究中,Bi-Huei Tsai 對(duì) ADR 市場(chǎng)進(jìn)行了測(cè)驗(yàn)以了解市場(chǎng)交易量[7]。此類算法對(duì)此類市場(chǎng)進(jìn)行的分析可以基于最近市場(chǎng)交易量提供最優(yōu)交易時(shí)間。作者分析了在派息日期間(派息日前后 10 天)的 ADR 交易量(每日交易量減去每日“正常”交易量)的超額比率,結(jié)果與派息稅率正相關(guān),為稅收政策對(duì) ADR 市場(chǎng)的影響提供了模型。交易者和政府稅收當(dāng)局都可以利用這一模型制定策略。
實(shí)時(shí)信用評(píng)級(jí)
這個(gè)應(yīng)用并非金融行業(yè)獨(dú)有,但與服務(wù)消費(fèi)者和中小企業(yè)的銀行有關(guān),那就是實(shí)時(shí)處理數(shù)據(jù)以進(jìn)行信用評(píng)級(jí)。例如,Klarna、Lenddo 和 Credit Karma 這樣的 FinTech 公司都提供有關(guān)在線信用評(píng)級(jí)和認(rèn)證的服務(wù)。在最近的工作中,王瑩、李思明和林張希(音譯)研究了電商的實(shí)時(shí)信用評(píng)級(jí)。
任何申請(qǐng)一大筆錢的人都會(huì)很熟悉處理流程。傳統(tǒng)上,銀行從申請(qǐng)表和其他渠道收集申請(qǐng)者的信息。專家分析這些信息并提出此客戶的信用建議,其中包含了利率和償還條款。申請(qǐng)者和銀行可能會(huì)有協(xié)商,可能為了整體而在不同貸款參數(shù)做妥協(xié)。簽訂貸款合同之后,客戶可以利用這筆錢并在未來償還貸款。
不僅是數(shù)據(jù)收集和條款協(xié)商浪費(fèi)時(shí)間,而且有兩個(gè)因素使得一切更加復(fù)雜。首先,很多用于信用評(píng)級(jí)的數(shù)據(jù)中心是按月更新的,所以銀行可能無法從這些來源得知客戶最近的財(cái)政問題。而且,非金融因素有可能增加違約風(fēng)險(xiǎn)。作者研究了幾個(gè)與大型電商平臺(tái)有關(guān)的因素:登錄平臺(tái)頻率、附加合同信息(包含手機(jī)號(hào)碼)的提供、上月交易量、整體成功交易數(shù)量、成為平臺(tái)客戶的時(shí)長(zhǎng)、客戶的業(yè)務(wù)領(lǐng)域等。基于這些參數(shù),作者對(duì)歷史數(shù)據(jù)進(jìn)行線性回歸分析,得到了違約概率和不同參數(shù)的關(guān)系。結(jié)果是可以幫助電商平臺(tái)基于用戶在線行為進(jìn)行信用評(píng)級(jí)的模型。傳統(tǒng)的中心化信用評(píng)級(jí)數(shù)據(jù)庫中甚至都沒有這些參數(shù)。
銀行業(yè)更加高科技
前述兩個(gè)例子絕沒有對(duì)金融領(lǐng)域的大數(shù)據(jù)算法應(yīng)用做出限制。盡管沒人能夠 100% 預(yù)測(cè)未來市場(chǎng),歷史數(shù)據(jù)和當(dāng)前市場(chǎng)參數(shù)的深度分析依舊提供了全面、自適應(yīng)的市場(chǎng)趨勢(shì)和市場(chǎng)行為模型。反過來,這些模型促進(jìn)了交易人員、金融機(jī)構(gòu)和其他玩家做出全面和快速的決策。
IT 精英的機(jī)會(huì)在于,為快速增長(zhǎng)的行業(yè)開發(fā)新的技術(shù)和解決方案。從 2014 年到 2015 年,F(xiàn)inTech 融資增加了不止一倍,預(yù)示著這一行業(yè)的機(jī)會(huì)和行業(yè)對(duì)于產(chǎn)品及解決方案的需求。圖 2 的大致分類為產(chǎn)品、流程和客戶體驗(yàn)方面的創(chuàng)新留下了巨大的空間。想到高科技驅(qū)動(dòng)的行業(yè)時(shí),首先想起的是金融行業(yè),這樣的日子可能不遠(yuǎn)了。
來源:36大數(shù)據(jù)
刷新相關(guān)文章
我要評(píng)論
活動(dòng)推薦more >
- 2018 上海國(guó)際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國(guó)際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國(guó)國(guó)際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
10#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新