政府統(tǒng)計大數(shù)據(jù)應(yīng)用模式:“互聯(lián)網(wǎng)+”還是“+互聯(lián)網(wǎng)”
【數(shù)據(jù)猿導(dǎo)讀】 目前政府統(tǒng)計可用大數(shù)據(jù)源較為匱乏,只集中在“互聯(lián)網(wǎng)+”的應(yīng)用模式貌似遠遠不夠,因此應(yīng)當同時推進“互聯(lián)網(wǎng)+”與“+互聯(lián)網(wǎng)”。從而促進線上線下不同類型數(shù)據(jù)之間的有效聚合,從而發(fā)揮大數(shù)據(jù)本身的巨大價值,更好地打造政府統(tǒng)計數(shù)據(jù)

一、引言
近年來,伴隨著新一代信息技術(shù)的快速發(fā)展,人類社會逐步邁入大數(shù)據(jù)時代。大數(shù)據(jù)已成為重要的國家資源,正在深刻地影響著時代發(fā)展進程,催生新的模式和業(yè)態(tài)。從世界工業(yè)革命發(fā)展歷史來看,如果說第一次工業(yè)革命以煤炭為基礎(chǔ)、以蒸汽機和印刷術(shù)為標志,第二次工業(yè)革命以石油為基礎(chǔ)、以內(nèi)燃機和電信技術(shù)為標志;第三次工業(yè)革命以核能基礎(chǔ)、以互聯(lián)網(wǎng)技術(shù)為標志,那么未來第四次工業(yè)革命很可能將會以可再生能源為基礎(chǔ)、以大數(shù)據(jù)為標志。以美國、英國為首的一些發(fā)達國家,以及聯(lián)合國、世界經(jīng)濟論壇、歐盟等國際組織,都已從政府和組織層面將大數(shù)據(jù)發(fā)展提升到戰(zhàn)略高度(UN Global Pulse,2012;World Economic Forum,2012)。我國政府高度重視現(xiàn)代信息技術(shù),尤其是大數(shù)據(jù)對社會經(jīng)濟發(fā)展的深刻影響。2015年3月5日第十二屆全國人大三次會議上,李克強總理在政府工作報告中首次提出“互聯(lián)網(wǎng)+”行動計劃,推動大數(shù)據(jù)研究與應(yīng)用,為我國各部門和行業(yè)未來發(fā)展提供了重要的支撐。
政府統(tǒng)計機構(gòu)作為國家(或地區(qū))應(yīng)用信息技術(shù)生產(chǎn)、管理和發(fā)布數(shù)據(jù)的職能部門,面對大數(shù)據(jù)帶來的影響和挑戰(zhàn),應(yīng)當積極應(yīng)對,充分利用大數(shù)據(jù)催生大變革,構(gòu)建政府統(tǒng)計大數(shù)據(jù)發(fā)展戰(zhàn)略和應(yīng)用模式,推動現(xiàn)代化統(tǒng)計體系建設(shè)。除了互聯(lián)網(wǎng)+”模式可選之外,目前社會經(jīng)濟中還存在一種較為新穎的、典型的模式——“+互聯(lián)網(wǎng)”模式。有一些文獻對兩種模式在經(jīng)濟新常態(tài)下的區(qū)別進行了探討,但針對政府統(tǒng)計大數(shù)據(jù)應(yīng)用情景下的探討則較為匱乏。不過,由于大數(shù)據(jù)主要源于互聯(lián)網(wǎng),針對大數(shù)據(jù)與政府統(tǒng)計的文獻可以為此問題研究提供重要參考。Eurostat(2014)概述了大數(shù)據(jù)對政府統(tǒng)計帶來的機遇與挑戰(zhàn)。Dass et al.(2013),Buelens et al.(2012),Cheung(2012)等認為大數(shù)據(jù)會為政府統(tǒng)計帶來較有意義的補充,并探討了大數(shù)據(jù)在交通和社交等領(lǐng)域中的應(yīng)用。Landefeld(2014)、Reimsbach-Kounatze(2015)等探討了如何將大數(shù)據(jù)與傳統(tǒng)政府統(tǒng)計數(shù)據(jù)進行整合,以及相關(guān)的隱私保護等問題。在國內(nèi)同類文獻方面,馬建堂(2013,2015)、趙彥云(2015)、鄭京平和王全眾(2012)、何強(2015)等研究探討了大數(shù)據(jù)為政府統(tǒng)計在數(shù)據(jù)標準與分類、工作機制設(shè)計、統(tǒng)計處理技術(shù)、統(tǒng)計法律法規(guī)等領(lǐng)域帶來的新課題,以及大數(shù)據(jù)在消費、零售、人口、農(nóng)業(yè)、交通等專業(yè)統(tǒng)計的應(yīng)用。整體而言,目前這些研究側(cè)重于大數(shù)據(jù)在政府統(tǒng)計的具體應(yīng)用研究,對其宏觀應(yīng)用模式選擇的討論較少,而這是關(guān)系到整個政府統(tǒng)計發(fā)展的重大戰(zhàn)略問題。本文嘗試對這一問題進行研究探討。
二、“互聯(lián)網(wǎng)+”與“+互聯(lián)網(wǎng)”的區(qū)別及對政府統(tǒng)計大數(shù)據(jù)應(yīng)用工作的意義
(一)“互聯(lián)網(wǎng)+”的概念
目前,對“互聯(lián)網(wǎng)+”概念的理解存在很多版本。李克強總理在2015年政府工作報告中與此概念相關(guān)的表述是:國家要制定“互聯(lián)網(wǎng)+”行動計劃,推動移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等與現(xiàn)代制造業(yè)結(jié)合,促進電子商務(wù)、工業(yè)互聯(lián)網(wǎng)和互聯(lián)網(wǎng)金融健康發(fā)展,引導(dǎo)互聯(lián)網(wǎng)企業(yè)拓展國際市場。2015年7月國務(wù)院在《國務(wù)院關(guān)于積極推進“互聯(lián)網(wǎng)+”行動的指導(dǎo)意見》中認為,“互聯(lián)網(wǎng)+”是把互聯(lián)網(wǎng)的創(chuàng)新成果與經(jīng)濟社會各領(lǐng)域深度融合,推動技術(shù)進步、效率提升和組織變革,提升實體經(jīng)濟創(chuàng)新力和生產(chǎn)力,形成更廣泛的以互聯(lián)網(wǎng)為基礎(chǔ)設(shè)施和創(chuàng)新要素的經(jīng)濟社會發(fā)展新形態(tài)。國家發(fā)展和改革委員會在《關(guān)于2014年國民經(jīng)濟和社會發(fā)展計劃執(zhí)行情況與2015年國民經(jīng)濟和社會發(fā)展計劃草案的報告》中,將其定義為:“互聯(lián)網(wǎng)+”代表一種新的經(jīng)濟形態(tài),即充分發(fā)揮互聯(lián)網(wǎng)在生產(chǎn)要素配置中的優(yōu)化和集成作用,將互聯(lián)網(wǎng)的創(chuàng)新成果深度融合于經(jīng)濟社會各領(lǐng)域之中,提高實體經(jīng)濟的創(chuàng)新力和生產(chǎn)力,形成更廣泛的以互聯(lián)網(wǎng)為基礎(chǔ)設(shè)施和實現(xiàn)工具的經(jīng)濟發(fā)展新形態(tài)。企業(yè)界對“互聯(lián)網(wǎng)+”也有一些具有代表性的定義。比如,馬化騰2015年在其全國人大議案《關(guān)于以“互聯(lián)網(wǎng)+”為驅(qū)動,推進我國經(jīng)濟社會創(chuàng)新發(fā)展的建議》中,認為“互聯(lián)網(wǎng)+”是指利用互聯(lián)網(wǎng)的平臺、信息通信技術(shù)把互聯(lián)網(wǎng)和包括傳統(tǒng)行業(yè)在內(nèi)的各行各業(yè)結(jié)合起來,從而在新領(lǐng)域創(chuàng)造一種新生態(tài)。阿里巴巴集團則認為,所謂“互聯(lián)網(wǎng)+”,就是指以互聯(lián)網(wǎng)為主的一整套信息技術(shù)(包括移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)技術(shù)等)在經(jīng)濟、社會生活各部門的擴散應(yīng)用過程。
綜合以上多種觀點,不難看出,“互聯(lián)網(wǎng)+”就是一種將互聯(lián)網(wǎng)與傳統(tǒng)行業(yè)有機整合的模式,其中“+”后面可以是金融、醫(yī)療、教育、交通等。李克強總理2015年政府工作報告中關(guān)于“互聯(lián)網(wǎng)+”的規(guī)劃主要是基于經(jīng)濟層面的考量,是強化互聯(lián)網(wǎng)主動與傳統(tǒng)行業(yè)融合的標志。當前中國經(jīng)濟正處于轉(zhuǎn)型升級的重要時期,創(chuàng)新驅(qū)動正在成為我國經(jīng)濟發(fā)展的新引擎?;ヂ?lián)網(wǎng)具有打破信息不對稱、降低交易成本、促進專業(yè)化分工和提升勞動生產(chǎn)率的特點,為經(jīng)濟轉(zhuǎn)型升級提供了重要機遇。作為已經(jīng)是世界制造業(yè)大國的中國來說,不僅需要繼續(xù)破解仍存在的粗放發(fā)展、核心競爭力依然薄弱等問題,更需要與基于互聯(lián)網(wǎng)技術(shù)的移動互聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等相結(jié)合,提升中國制造業(yè)的成色與品質(zhì)。同時,“互聯(lián)網(wǎng)+”帶來的新商業(yè)模式和商業(yè)業(yè)態(tài),還將激發(fā)著社會和市場的潛力、活力,逐步成為中國經(jīng)濟提質(zhì)增效升級的“新引擎”。
(二)“+互聯(lián)網(wǎng)”的概念
“+互聯(lián)網(wǎng)”的概念是在“互聯(lián)網(wǎng)+”的基礎(chǔ)上提出的。一般而言,“+互聯(lián)網(wǎng)”主要是指傳統(tǒng)行業(yè)以既有業(yè)務(wù)為基礎(chǔ),主動利用互聯(lián)網(wǎng)技術(shù)和理念,提高為用戶服務(wù)的效率和質(zhì)量的發(fā)展模式。
從國際上看,德國的“工業(yè)4.0戰(zhàn)略”、美國的“工業(yè)互聯(lián)網(wǎng)”等模式,都可以大致認為是“+互聯(lián)網(wǎng)”模式在具體領(lǐng)域的應(yīng)用范例。主動利用互聯(lián)網(wǎng)進行自我創(chuàng)新甚至自我革命,具體到每一個行業(yè)企業(yè)可能模式各異,但總體上這條路是符合“繼承——創(chuàng)新——再繼承——再創(chuàng)新”這種模式循環(huán)往復(fù)的。舉例而言,原來以線下實體店銷售產(chǎn)品的蘇寧電器,近幾年就通過“+互聯(lián)網(wǎng)”模式成功轉(zhuǎn)型。2013年2月,蘇寧正式更名為“蘇寧云商”。伴隨著企業(yè)名稱的更換,蘇寧在同年6月8日正式推行“線上線下一體價”策略,強調(diào)線上線下渠道在商品、服務(wù)、價格方面的融合,線下實體店與線上網(wǎng)站同步共享資源,利用它遍布各地的線下實體店可以很方便地為客戶提貨送貨,實現(xiàn)內(nèi)部資源使用效率的最大化,同時也為用戶提供更開放的服務(wù)。這是我國首例大型零售商全面推行線上線下同價的做法,是蘇寧多渠道融合的重要一步。2014年4月,該企業(yè)還正式推出蘇寧互聯(lián)的品牌,開放虛擬運營商業(yè)務(wù),給用戶提供通信服務(wù)。主動利用互聯(lián)網(wǎng)自我革新、從線下到線上模式的有效轉(zhuǎn)換,是蘇寧在其行業(yè)獲取成功的重要經(jīng)驗。
(三)“互聯(lián)網(wǎng)+”與“+互聯(lián)網(wǎng)”的區(qū)別
“互聯(lián)網(wǎng)+”與“+互聯(lián)網(wǎng)”的差異包括兩方面:
第一,“互聯(lián)網(wǎng)+”側(cè)重于從線上到線下的過程,而“+互聯(lián)網(wǎng)”則側(cè)重于從線下到線上的過程。“互聯(lián)網(wǎng)+”的主導(dǎo)者往往是互聯(lián)網(wǎng)企業(yè)(如阿里巴巴等),從技術(shù)、商業(yè)模式、資金、人才等方面看,都是互聯(lián)網(wǎng)企業(yè)主導(dǎo)著融合進程。“+互聯(lián)網(wǎng)”則正好相反,主要是傳統(tǒng)企業(yè)在主導(dǎo)著融合進程。比如,以淘寶網(wǎng)為代表的網(wǎng)商,首先通過線上的B2C或C2C等形式進行交易,然后再經(jīng)過線下的快遞、郵寄等形式發(fā)貨,這就是典型的“互聯(lián)網(wǎng)+”模式。而前述蘇寧電器的轉(zhuǎn)型模式則是典型的“+互聯(lián)網(wǎng)”模式。
第二,“互聯(lián)網(wǎng)+”具有新技術(shù)優(yōu)勢、體制機制優(yōu)勢和更廣泛的社會支持,容易產(chǎn)生爆發(fā)性增長。而“+互聯(lián)網(wǎng)”擁有存量優(yōu)勢、行業(yè)標準優(yōu)勢和公信力優(yōu)勢。“互聯(lián)網(wǎng)+”模式下,互聯(lián)網(wǎng)技術(shù)是基礎(chǔ),再加上其優(yōu)惠的價格、便捷的操作、舒適的體驗,足以贏得巨量消費者,典型的例子就是支付寶,它是“互聯(lián)網(wǎng)+金融”的應(yīng)用代表。同時,李克強總理2015年的政府工作報告還給該模式帶來了很大的輿論優(yōu)勢。不過,該政府工作報告提“互聯(lián)網(wǎng)+”而不是“+互聯(lián)網(wǎng)”,不是忽略傳統(tǒng)企業(yè)的作用,更多是希望用互聯(lián)網(wǎng)這種先進的生產(chǎn)力來倒逼傳統(tǒng)產(chǎn)業(yè)革新發(fā)展。相比之下,在“+互聯(lián)網(wǎng)”模式中,一方面迫于外部特別是互聯(lián)網(wǎng)企業(yè)的壓力,另一方面也迫于內(nèi)部問題導(dǎo)向的壓力,傳統(tǒng)企業(yè)正在積極主動利用互聯(lián)網(wǎng)技術(shù)提高自身服務(wù)客戶的能力。這種模式雖然輿論聲勢不及“互聯(lián)網(wǎng)+”,但其發(fā)展態(tài)勢非常迅猛,目前也催生一些重要的行業(yè)應(yīng)用模式,如德國的“工業(yè)4.0戰(zhàn)略”和美國的“工業(yè)互聯(lián)網(wǎng)”。
(四)政府統(tǒng)計大數(shù)據(jù)應(yīng)用戰(zhàn)略模式中的“互聯(lián)網(wǎng)+”與“+互聯(lián)網(wǎng)”
大數(shù)據(jù)在政府統(tǒng)計中的應(yīng)用模式,既包括“互聯(lián)網(wǎng)+”,也包括“+互聯(lián)網(wǎng)”,但這兩種模式存在不同的特點。
政府統(tǒng)計大數(shù)據(jù)應(yīng)用中的“互聯(lián)網(wǎng)+”模式,是指那種“政府統(tǒng)計部門可以通過互聯(lián)網(wǎng)在線上無技術(shù)障礙地獲取、存儲、分析處理數(shù)據(jù)”的模式①。比如,對于淘寶、天貓、京東、1號店等電子商務(wù)網(wǎng)站,其商品的分類、價格等數(shù)據(jù),政府統(tǒng)計部門均可以通過網(wǎng)絡(luò)爬蟲等技術(shù)動態(tài)獲取、存儲,進而可以在線下進一步清洗和挖掘。
政府統(tǒng)計大數(shù)據(jù)應(yīng)用中的“+互聯(lián)網(wǎng)”模式,是指那種“數(shù)據(jù)原本存儲在政府、企業(yè)、家庭等單位的數(shù)據(jù)庫,政府統(tǒng)計部門無法在線獲取、存儲、分析處理,但這些單位主動將數(shù)據(jù)上線,進而政府統(tǒng)計部門可以無技術(shù)障礙地獲取”的模式。比如,某科研機構(gòu)部門利用科研專項基金,開展了一項關(guān)于居民消費支出情況的調(diào)查,取得了很多家庭的微觀數(shù)據(jù)。如果該機構(gòu)主動將這項調(diào)查數(shù)據(jù)對外公開、共享,政府統(tǒng)計部門也可以獲取,則這種模式就可以認為是“+互聯(lián)網(wǎng)”模式的一種具體應(yīng)用。
三、政府統(tǒng)計大數(shù)據(jù)應(yīng)用的戰(zhàn)略模式選擇
本文認為,大數(shù)據(jù)在政府統(tǒng)計應(yīng)用中的戰(zhàn)略模式,不宜只集中在“互聯(lián)網(wǎng)+”,而是應(yīng)當同時推進“互聯(lián)網(wǎng)+”與“+互聯(lián)網(wǎng)”,且在目前政府統(tǒng)計可用大數(shù)據(jù)源較為匱乏的情況下,應(yīng)該給予“+互聯(lián)網(wǎng)”模式更大的重視力度,積極打破信息共享壁壘,實現(xiàn)數(shù)據(jù)的互聯(lián)互通互享,更好地打造政府統(tǒng)計數(shù)據(jù)源第二軌,持續(xù)提升中國政府統(tǒng)計的現(xiàn)代化水平。
(一)當前基于“互聯(lián)網(wǎng)+”模式的,可為政府統(tǒng)計所用的數(shù)據(jù)源較少,“+互聯(lián)網(wǎng)”有助于迅速擴大政府統(tǒng)計可用的數(shù)據(jù)源,更大程度地發(fā)揮數(shù)據(jù)聚合價值
這可以從大數(shù)據(jù)的分類上進一步闡釋。如果從數(shù)據(jù)產(chǎn)生主體的角度來分,在馬建堂(2013,2015)研究的基礎(chǔ)上,將目前可應(yīng)用于政府統(tǒng)計的大數(shù)據(jù),歸為行政記錄數(shù)據(jù)、商業(yè)記錄數(shù)據(jù)、互聯(lián)網(wǎng)與傳感器數(shù)據(jù)三大類,如表1所示。
不難發(fā)現(xiàn),表1中除了部分行政記錄數(shù)據(jù),以及部分基于“互聯(lián)網(wǎng)+”模式的電子商務(wù)交易數(shù)據(jù)、社交網(wǎng)數(shù)據(jù)、媒體數(shù)據(jù)可以無技術(shù)障礙地獲取外,其余數(shù)據(jù)均需通過“+互聯(lián)網(wǎng)”模式導(dǎo)入到互聯(lián)網(wǎng),才能成為政府統(tǒng)計可用的大數(shù)據(jù)源。事實上,盡管當今社會逐步邁入大數(shù)據(jù)時代,但通過常規(guī)統(tǒng)計工作流程從住戶、企業(yè)等部門獲取數(shù)據(jù)的難度越來越大,調(diào)查對象不配合工作的現(xiàn)象時有發(fā)生,一套表制度的實施并沒有從數(shù)據(jù)源頭解決數(shù)據(jù)匱乏問題,而且已有的行業(yè)企業(yè)數(shù)據(jù)資源均立足行業(yè)企業(yè)本身的統(tǒng)計標準,彼此之間存在口徑差異(比如阿里巴巴集團和1號店對各自線上零售品的分類),形成了眾多“信息孤島”,無法形成數(shù)據(jù)合力,產(chǎn)生更大價值。因此,做好“+互聯(lián)網(wǎng)”是實現(xiàn)“互聯(lián)網(wǎng)+”計劃的重要前提之一,有助于政府統(tǒng)計部門逐步實現(xiàn)從“生產(chǎn)—管理”型向“管理—生產(chǎn)”型的職能轉(zhuǎn)變。
從中國國家統(tǒng)計局的實踐經(jīng)驗來看,盡管在2013年和2014年分別與阿里巴巴、百度、騰訊等17家知名企業(yè)簽署了大數(shù)據(jù)戰(zhàn)略合作協(xié)議,至今為止仍沒有開發(fā)出一個成熟的、重要的大數(shù)據(jù)統(tǒng)計指標,這與數(shù)據(jù)使用的壁壘高度相關(guān)。此外,筆者重點以商業(yè)記錄數(shù)據(jù)為例進行考察發(fā)現(xiàn),目前其數(shù)據(jù)源應(yīng)用主要有兩條途徑:一是積極整合行業(yè)企業(yè)內(nèi)部的各種數(shù)據(jù)源,通過對整合后的數(shù)據(jù)進行挖掘分析,從而開展大數(shù)據(jù)應(yīng)用;二是積極借助外部數(shù)據(jù)(主要是互聯(lián)網(wǎng)數(shù)據(jù))來實現(xiàn)相關(guān)應(yīng)用。但是,現(xiàn)有的數(shù)據(jù)源中,仍然以機構(gòu)內(nèi)部數(shù)據(jù)為主(比例普遍超過50%,多數(shù)行業(yè)超過80%),原因主要是數(shù)據(jù)的開放和交易尚未形成市場主流形態(tài)。以國內(nèi)主要的電子商務(wù)交易行業(yè)企業(yè)為例,雖然目前推出了很多價格指數(shù)等大數(shù)據(jù)應(yīng)用成果(如1號店指數(shù)以及阿里巴巴網(wǎng)購(全網(wǎng))價格指數(shù)等),但這些成果基本都是為企業(yè)服務(wù)的,由于法律和數(shù)據(jù)交易機制不健全,這些企業(yè)的交易平臺在開放交易數(shù)據(jù)方面仍然持謹慎態(tài)度,嚴重限制了大數(shù)據(jù)的聚合發(fā)展,彰顯當前促進“+互聯(lián)網(wǎng)”模式發(fā)展的迫切性。
(二)著重支持“+互聯(lián)網(wǎng)”模式,有利于數(shù)據(jù)溯源,輔助甄別數(shù)據(jù)類型,保護用戶數(shù)據(jù)所有權(quán)
政府統(tǒng)計大數(shù)據(jù)的來源主要包括兩方面:一是普查、戶籍、社保、醫(yī)保、電信、金融等傳統(tǒng)結(jié)構(gòu)化數(shù)據(jù)以及在此基礎(chǔ)上延伸、擴展后形成的海量非結(jié)構(gòu)化數(shù)據(jù);二是基于互聯(lián)網(wǎng)、傳感器、GPS等現(xiàn)代信息技術(shù)產(chǎn)生的新數(shù)據(jù),如微博、微信、博客、論壇等社交媒體產(chǎn)生的數(shù)據(jù)。由于數(shù)據(jù)來源類型多樣,所以有必要利用數(shù)據(jù)溯源技術(shù),記錄數(shù)據(jù)的來源、所有權(quán)及其傳播、變化過程,據(jù)此可以方便地驗算結(jié)果的正確性,或者以極小的代價進行數(shù)據(jù)更新,并為數(shù)據(jù)挖掘與應(yīng)用提供輔助支持。
“+互聯(lián)網(wǎng)”模式的從線下到線上的典型特征,可以很好地滿足數(shù)據(jù)溯源的需求,通過數(shù)據(jù)來源可以對不同類型的數(shù)據(jù)進行有針對性地清洗和校正,提升數(shù)據(jù)挖掘與建模時的科學(xué)性,并使得數(shù)據(jù)的所有權(quán)得到維護,這還會進一步促進數(shù)據(jù)的開放與共享,形成良性循環(huán)。
(三)“+互聯(lián)網(wǎng)”模式有助于在“互聯(lián)網(wǎng)+”模式的基礎(chǔ)上,從多種角度評估政府統(tǒng)計數(shù)據(jù)質(zhì)量,同時還可以強化社會對統(tǒng)計工作的監(jiān)督,及時把握政府統(tǒng)計輿情
對政府統(tǒng)計數(shù)據(jù)質(zhì)量科學(xué)評估,既關(guān)系到國家宏觀調(diào)控的有效性,也關(guān)系到各類市場經(jīng)濟主體的切身利益,更對統(tǒng)計部門乃至整個政府部門的公信力有重要影響。目前,對政府統(tǒng)計數(shù)據(jù)質(zhì)量評估的方法主要包括邏輯檢驗、計量經(jīng)濟模型分析、核算數(shù)據(jù)重估、統(tǒng)計分布檢驗、調(diào)查誤差評估等方法(馮蕾、周晶,2013;許滌龍、葉少波,2011),這些方法的共同特點是主要基于統(tǒng)計數(shù)據(jù)本身進行評估,側(cè)重于統(tǒng)計方法的研究,缺乏從大數(shù)據(jù)源角度的研究。
“+互聯(lián)網(wǎng)”模式鼓勵更多的數(shù)據(jù)生產(chǎn)主體,包括政府部門、研究機構(gòu)、企業(yè)、個人等主體,從多種角度公開數(shù)據(jù)源,為研究政府統(tǒng)計數(shù)據(jù)質(zhì)量問題提供更多樣化、更詳細的數(shù)據(jù)。比如,針對中國收入分配狀況的基尼系數(shù)研究,北京大學(xué)、中國人民大學(xué)、北京師范大學(xué)、西南財經(jīng)大學(xué)等機構(gòu),都曾利用專項的基金針對中國家庭收入和消費情況進行調(diào)查,測算了相應(yīng)的基尼系數(shù),而且這些測算結(jié)果與國家統(tǒng)計局公布的結(jié)果存在一定差異,這對評估后者的數(shù)據(jù)質(zhì)量提供了重要的數(shù)據(jù)來源。如果基于“+互聯(lián)網(wǎng)”模式的數(shù)據(jù)源進一步增大,則更有裨益。因為對大數(shù)據(jù)應(yīng)用而言,數(shù)據(jù)量通常需要超過一定規(guī)模,這是由于利用大數(shù)據(jù)建模預(yù)測時,需要對數(shù)據(jù)反復(fù)進行訓(xùn)練,以便找到擬合更好的訓(xùn)練模型,因此用來訓(xùn)練模型的數(shù)據(jù)總量必須要足夠多,如果少于一定規(guī)模,就會出現(xiàn)所謂“過度擬合”(即為了得到一致假設(shè)而使假設(shè)變得過度復(fù)雜)。此外,大數(shù)據(jù)中的噪音數(shù)據(jù)往往會以有意義的模式出現(xiàn),從而會繞過普通訓(xùn)練模型的監(jiān)控,這就需要更大的數(shù)據(jù)量進行矯正。
另一方面,隨著互聯(lián)網(wǎng)中可用數(shù)據(jù)源增多,社會公眾會從各個角度對政府統(tǒng)計數(shù)據(jù)進行評價,在人人均可為自媒體的互聯(lián)網(wǎng)時代,這些輿情對統(tǒng)計工作具有較強的監(jiān)督功能,倒逼政府統(tǒng)計進一步提升工作效能和數(shù)據(jù)質(zhì)量,多年以來政府統(tǒng)計實踐工作也充分印證了這一點。
四、結(jié)語
本文探討了在政府統(tǒng)計大數(shù)據(jù)應(yīng)用中,如何科學(xué)對待“互聯(lián)網(wǎng)+”和“+互聯(lián)網(wǎng)”兩種發(fā)展模式的戰(zhàn)略性問題。本文無意于絕對否定或肯定某一種模式的價值與意義,而是啟示研究者根據(jù)社會經(jīng)濟發(fā)展以及政府統(tǒng)計發(fā)展的不同階段選擇更為合適的發(fā)展模式。從數(shù)據(jù)應(yīng)用的角度而言,“互聯(lián)網(wǎng)+”和“+互聯(lián)網(wǎng)”兩種模式之間誠然存在分歧,但并不重要,重要的是如何促進線上線下不同類型數(shù)據(jù)之間的有效聚合,消除數(shù)據(jù)信息壁壘,從而發(fā)揮大數(shù)據(jù)本身的巨大價值,為服務(wù)型政府統(tǒng)計建設(shè)提供更強有力的支撐。
來源:國家統(tǒng)計局統(tǒng)計科學(xué)研究所
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
9#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會丨《云MSP發(fā)展白皮書》重