中國社會科學院樊明太:深化對大數(shù)據(jù)的科學認識
樊明太 | 2016-01-05 17:30
【數(shù)據(jù)猿導讀】 大數(shù)據(jù)這個詞如今可謂是家喻戶曉,如果現(xiàn)在有人還沒聽說過這個詞,那可真就out了,然而又有多少人真正了解這三個字代表這什么呢,不要說非it人士,甚至有些業(yè)內(nèi)人士對其也是一知半解,因此中國社會科學院樊明太提出:要深化對大數(shù)據(jù)的科學認識

近年來,隨著信息技術和通信技術革命的深化和創(chuàng)新,人類社會進入了信息數(shù)據(jù)化、大數(shù)據(jù)及云計算時代,大數(shù)據(jù)也因此成為創(chuàng)新、競爭和生產(chǎn)力的一個前沿,并開啟時代轉(zhuǎn)型。所謂“大數(shù)據(jù)”,一般指規(guī)模超出典型數(shù)據(jù)庫軟件工具可以捕獲、存儲、管理和分析能力的數(shù)據(jù)集。人們有意不明確數(shù)據(jù)集作為大數(shù)據(jù)要達到怎樣的規(guī)模臨界點,是因為大數(shù)據(jù)隱含地強調(diào)這一規(guī)模臨界點具有動態(tài)性、主觀性,會隨技術動態(tài)進步而提高,會隨部門普遍可行的軟件工具和特定行業(yè)普遍的數(shù)據(jù)集規(guī)模而有所差異。大數(shù)據(jù)理念在引起社會各界廣泛關注的同時,要求我們深化對大數(shù)據(jù)的科學認識,理性對待大數(shù)據(jù)。
信息及通信技術革命催生大數(shù)據(jù)
20世紀末的信息技術和通信技術革命,產(chǎn)生了以計算機和互聯(lián)網(wǎng)為主要標志的新經(jīng)濟工具。伴隨著信息技術和通信技術的革命以及新經(jīng)濟的深化,數(shù)據(jù)的增長、存儲、傳輸、讀取及計算速度得以越過拐點而急劇加速,大數(shù)據(jù)也因此被廣泛應用于經(jīng)營決策和風險管理領域,大數(shù)據(jù)時代應運而來。
以計算機和互聯(lián)網(wǎng)為主要標志的新經(jīng)濟工具,催生了信息的爆炸式數(shù)據(jù)化,而數(shù)據(jù)化使得信息精準化得以實現(xiàn)。數(shù)據(jù)是信息的一種表現(xiàn)形式,數(shù)據(jù)本身的產(chǎn)生是交流信息的需要,而信息的數(shù)據(jù)化是信息精準化的需要。一個經(jīng)濟體的發(fā)展狀況需要根據(jù)國民經(jīng)濟核算體系及國內(nèi)生產(chǎn)總值(GDP)/國民生產(chǎn)總值(GNP)指標和數(shù)據(jù)來衡量,如果沒有相應的指標及數(shù)據(jù),就不好進行量化分析和比較。因此,信息的數(shù)據(jù)化成為非常重要的資產(chǎn)。如果沒有現(xiàn)在的信息數(shù)據(jù)化,我們將無法獲知許多信息。由于計算機和互聯(lián)網(wǎng)等新經(jīng)濟工具的發(fā)展,數(shù)據(jù)的增長得以突破拐點,隨之“摩爾定律”發(fā)揮作用,數(shù)據(jù)指數(shù)效應爆發(fā)。
數(shù)據(jù)存儲的革命,來自于磁帶取代穿孔卡片機;隨后發(fā)明的磁盤驅(qū)動器,則使數(shù)據(jù)可以由以計算機和互聯(lián)網(wǎng)為主要標志的新經(jīng)濟工具進行隨機存儲、傳輸和讀取,并使數(shù)據(jù)庫由傳統(tǒng)的層次型向網(wǎng)狀型、關系型轉(zhuǎn)變,為決策支持系統(tǒng)和商業(yè)智能系統(tǒng)提供了基礎。過去,光盤因容量小而限制了其數(shù)據(jù)存儲和讀寫能力,更限制了信息的傳輸。現(xiàn)在,大數(shù)據(jù)技術加快了數(shù)據(jù)的存儲、傳輸和讀寫能力,同時也降低了信息獲取成本。
中國社會科學院數(shù)量與技術經(jīng)濟研究所研究室主任樊明太
以計算機和互聯(lián)網(wǎng)為主要標志的新經(jīng)濟工具,也使得數(shù)據(jù)可以通過計算而自我產(chǎn)生和方便應用。傳統(tǒng)的數(shù)據(jù)由于規(guī)模限制可以被隨機計算,但大數(shù)據(jù)則需要應用云計算來實現(xiàn)。資本市場基于股價和交易量可以計算很多技術指標,銀行運營基于現(xiàn)金流量表和資產(chǎn)負債表也可以計算很多監(jiān)管指標,幫助人們進行交易、治理和風險預警。在大數(shù)據(jù)的技術支持下,這些技術指標和監(jiān)管指標可以內(nèi)在地動態(tài)生成關系數(shù)據(jù)庫,使數(shù)據(jù)本身價值化,并實現(xiàn)決策智能化。
大數(shù)據(jù)可擴展預測性模型價值
大數(shù)據(jù)的價值在于其隱含信息的價值,以及數(shù)據(jù)集所顯現(xiàn)的信息量的規(guī)模(Volume)、多樣化(Variety)、信息產(chǎn)生、加工和相互之間關系變化的高速化(Velocity)。大數(shù)據(jù)來源于信息的數(shù)據(jù)化,必須是以信息為基礎,沒有信息就無所謂大數(shù)據(jù),但數(shù)據(jù)規(guī)模大不一定是好的,關鍵是要內(nèi)涵信息量大。數(shù)據(jù)集作為信息資產(chǎn),需要成本有效、創(chuàng)新的信息加工格式,同時必須有助于強化洞察力和改善決策價值。大數(shù)據(jù)中的信息要內(nèi)容完整一致并內(nèi)在精準;數(shù)據(jù)集作為信息資產(chǎn)還需要具有生命力、處方價值和預測價值。
在大數(shù)據(jù)情景下,人們并非只是簡單地收集大量的數(shù)據(jù),而是希望從中仔細選擇最有可能影響結(jié)果的多重屬性因素和變量,通過快速而成本有效地檢驗和確認變量的相關性來評估數(shù)據(jù)的生命力。一旦可以確認一系列逐漸擴大的關鍵變量集及相應的多維度數(shù)據(jù),我們就可以揭示這些變量之間的隱性關系并建立有效的預測性模型,應用這些關系和模型進行處方性模擬和結(jié)果預測,并通過隨后揭示一個實際上不可測度的剩余變量的組合影響來擴展預測性模型的價值。可見,數(shù)據(jù)本身的價值化,不僅取決于基于數(shù)據(jù)識別的關鍵因果變量之間潛在的隱性關系及相應的有效預測性模型,同時還取決于識別一個實際上不可測度的剩余變量的組合及其影響估計。
大數(shù)據(jù)具有信息多樣化特征,這使得研究經(jīng)濟和社會不再局限于宏觀研究,而是可以利用多維度的大數(shù)據(jù),研究微觀個體的不同狀況和行為(如家庭消費金融狀況和行為),研究信貸政策對具體行業(yè)或企業(yè)的就業(yè)、利潤、產(chǎn)出價格等的微觀影響。大數(shù)據(jù)的微觀化、多維度既是信息多樣化的產(chǎn)物,也會衍生進一步的多樣化信息。
大數(shù)據(jù)的產(chǎn)生伴隨著經(jīng)濟活動快速化和信息自我派生能力而得以加強,這會使數(shù)據(jù)的產(chǎn)生速度急劇加快,即呈現(xiàn)出信息高速化特征。大數(shù)據(jù)的加工能力由于計算機等新經(jīng)濟工具的革命性而獲得突破性進展,數(shù)據(jù)科學家已將網(wǎng)格計算、云計算、數(shù)據(jù)庫內(nèi)生計算等計算技術提高到人們不可想象的水平。而且,伴隨著大數(shù)據(jù)生成和加工的摩爾效應,大數(shù)據(jù)內(nèi)部關鍵變量的形成和互動關系也發(fā)生著急劇的變化。大數(shù)據(jù)如果沒有相應的信息高速化,現(xiàn)在很多東西也無所謂大數(shù)據(jù)。
大數(shù)據(jù)由于其大、雜、快,更需要在數(shù)據(jù)庫設計時仔細考慮信息的完整一致性、內(nèi)在精準性和生命力。大數(shù)據(jù)的規(guī)劃必須在成本有效和技術支持條件下,兼顧大數(shù)據(jù)全集的完整性和采樣的隨機代表性,兼顧大數(shù)據(jù)信息的混雜性和精準性,兼顧大數(shù)據(jù)的相關性和因果性。大數(shù)據(jù)如果失去了辨識度也就失去了有效性。大數(shù)據(jù)的相關性是其因果性的前提,但其相關性不一定具有因果性,大數(shù)據(jù)如果失去了其內(nèi)部的因果關系也就失去了生命力。大數(shù)據(jù)的信息精準及生命力取決于噪聲過濾、查漏補缺和去偽存真能力。
大數(shù)據(jù)影響人類認知和行為習慣
大數(shù)據(jù)為信息數(shù)字化、信息標準化和信息價值化創(chuàng)造了條件和基礎,社會和經(jīng)濟主體可以據(jù)此進行數(shù)據(jù)相關性和因果關系分析、趨勢預測和實驗博弈,而在研究數(shù)據(jù)之間的相關關系時,最好還要注意其相應的機制和行為含義。
第一,大數(shù)據(jù)既是新經(jīng)濟的新載體,也來自新經(jīng)濟的驅(qū)動。一方面,大數(shù)據(jù)成為新經(jīng)濟的生產(chǎn)要素和資產(chǎn),是新經(jīng)濟和互聯(lián)網(wǎng)金融的新載體。按照2008年國民經(jīng)濟核算體系,GDP核算中首次把研發(fā)支出歸入固定資產(chǎn)投資,從而使研發(fā)和軟件歸入知識產(chǎn)權產(chǎn)品、大數(shù)據(jù)歸入數(shù)字資本,這意味著企業(yè)研發(fā)支出、軟件和數(shù)據(jù)支出過去劃入企業(yè)成本,現(xiàn)在則劃入企業(yè)投資。這樣,數(shù)據(jù)和軟件就變成了資產(chǎn),成為生產(chǎn)要素。從這個角度來說,大數(shù)據(jù)是新經(jīng)濟的重要組成部分和新載體。另一方面,新經(jīng)濟工具的革命性創(chuàng)新,也驅(qū)動著大數(shù)據(jù)的產(chǎn)生和互聯(lián)網(wǎng)金融發(fā)展。近年來,在金融領域,基于大數(shù)據(jù)計算的比特幣應運而生,互聯(lián)網(wǎng)金融由于大數(shù)據(jù)、云計算、社交網(wǎng)絡和搜索引擎等新經(jīng)濟工具的突破和應用而拓寬了經(jīng)濟學中的“交易可能性邊界”,導致互聯(lián)網(wǎng)金融新業(yè)態(tài)快速發(fā)展,從而使其開始與傳統(tǒng)銀行業(yè)進行現(xiàn)實博弈。
第二,大數(shù)據(jù)意味著人類對社會的認知、交流和決策的革新,將影響居民、企業(yè)和政府的行為習慣和市場規(guī)則,有利于提高社會生產(chǎn)率、改善消費者剩余。由于現(xiàn)代信息技術和互聯(lián)網(wǎng)革命,人類對社會的認知逐步數(shù)字化,人類之間的交流借助數(shù)據(jù)標準化實現(xiàn)了傳輸和視頻化,人類進行決策也多基于數(shù)據(jù)定量分析而非經(jīng)驗和直覺。比如,經(jīng)濟學者基于經(jīng)濟數(shù)據(jù)分析和模型計算進行經(jīng)濟預測、企業(yè)發(fā)展規(guī)劃、大型工程項目經(jīng)濟評估。如果沒有相關數(shù)據(jù)及信息,這些都是很難想象的。此外,大數(shù)據(jù)的有效利用可以提高社會的生產(chǎn)率。在經(jīng)濟學的生產(chǎn)函數(shù)中,生產(chǎn)率反映生產(chǎn)要素的績效及組合。大數(shù)據(jù)的有效利用也會改善消費者剩余。在福利經(jīng)濟學中,消費者剩余反映消費者購買時的支付意愿扣除實際支付外所感覺的額外收益。
來源:中國社會科學報
刷新相關文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風起云涌時,共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風險感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
9#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會丨《云MSP發(fā)展白皮書》重