“數(shù)博會”聽大咖說(五):把握全球發(fā)展趨勢 增強產(chǎn)業(yè)智慧力量
牛悅 | 2016-05-26 15:28
【數(shù)據(jù)猿導讀】 數(shù)博會多個論壇同時進行,為了避免大家錯過精彩觀點,本文主要給大家盤點了數(shù)博會現(xiàn)場大咖們的精彩觀點

5月25日,作為2016中國大數(shù)據(jù)產(chǎn)業(yè)峰會暨中國電子商務創(chuàng)新發(fā)展峰會的重要內(nèi)容之一:第一屆大數(shù)據(jù)科學與工程國際會議舉行,此次論壇分為一個主論壇、四個主題論壇和兩個子論壇。該論壇主要關注全球大數(shù)據(jù)發(fā)展趨勢以及大數(shù)據(jù)在學科交叉領域中的研究應用,探討大數(shù)據(jù)發(fā)展中面臨的挑戰(zhàn)、技術創(chuàng)新、應用創(chuàng)新等方向,著力反映國際大數(shù)據(jù)技術研究的最新進展。
會上,圍繞大數(shù)據(jù)科學認識與理解、大數(shù)據(jù)分析與管理、大數(shù)據(jù)系統(tǒng)、大數(shù)據(jù)安全、大數(shù)據(jù)學科與人才等領域,中國工程院院士鄔賀銓、中國工程院院士方濱興、中國科學院院士梅宏、美國伊利諾伊大學芝加哥分校特聘主任教授、清華大學數(shù)據(jù)科學研究院院長俞士綸、美國特拉華大學電子與計算機工程學院終身教授高光榮、英國帝國理工學院數(shù)據(jù)科學研究所所長郭毅可等專家學者及相關企業(yè)代表發(fā)表主旨講話。
中國工程院院士鄔賀銓:大數(shù)據(jù)是博大精深的
“大數(shù)據(jù)不能以‘大’蓋全,它是已發(fā)生事件規(guī)律的總結(jié)。”昨天,中國工程院院士鄔賀銓在“第一屆大數(shù)據(jù)科學與工程國際會議(2016)——大數(shù)據(jù)科學認識與理解”論壇上發(fā)表了主旨演講。他指出,大數(shù)據(jù)不僅是數(shù)據(jù)量的龐大,而且是多維度和具有代表性的。同時,大數(shù)據(jù)追求數(shù)據(jù)精準,而且強調(diào)規(guī)律,其“深”又在于大數(shù)據(jù)的分析不僅需要大量的數(shù)據(jù)而且需要建立模型。
首先,鄔賀銓指出,大數(shù)據(jù)具有多個來源,其中包括社會空間數(shù)據(jù)、物理空間數(shù)據(jù)、信息空間數(shù)據(jù)三個方面。又可以分為國家安全數(shù)據(jù)、商業(yè)秘密數(shù)據(jù)、個人隱私數(shù)據(jù)。從結(jié)構上來看,大數(shù)據(jù)可分成結(jié)構化、半結(jié)構化、非結(jié)構化,其中,非結(jié)構化,是不能用表格來表示的數(shù)據(jù)。
在鄔賀銓看來,大數(shù)據(jù)具有增長性、長期性、顆粒性、移動性、多維性、語義性、隱私性等特點。大數(shù)據(jù)只有大于一定量時才有用,到2020年人類的數(shù)據(jù)量可能會達到40ZB,如果裝到光盤上,其重量需要幾十艘美國的“尼克茲航母”才能裝下。目前,各行各業(yè)每天都產(chǎn)生著大量的數(shù)據(jù)。
然而,大數(shù)據(jù)不僅是數(shù)據(jù)大,而且是多維度與具有代表性的。麥肯錫曾評價大數(shù)據(jù)價值堪比石油,但礦產(chǎn)資源因不可再生通常會隨時間而增值,信息資產(chǎn)則隨著互聯(lián)網(wǎng)發(fā)展會越來越多但折舊很快。比如,谷歌公司,根據(jù)美國阿特蘭大中部地區(qū)2008年春夏之交有關流感的搜索詞頻率異常增長而成功判斷即將爆發(fā)流感,但流感疫情的前兆與有關流感搜索詞突發(fā)的相關性的逆命題并不成立,導致谷歌對2012年底美國流感的預測結(jié)果比實際情況過分夸大。這不是大數(shù)據(jù)的失效,而是谷歌內(nèi)容如能更多關注和收集搜索引擎之外的大數(shù)據(jù)效果會更好。
提到大數(shù)據(jù)的“精”,鄔賀銓說,通常指的是大數(shù)據(jù)追求數(shù)據(jù)精準但強調(diào)規(guī)律,這應理解為對于一個大數(shù)據(jù)集而言,我們很難要求所有數(shù)據(jù)都精準,都只需要大多數(shù)數(shù)據(jù)有代表性,這并不妨礙數(shù)據(jù)集合得到較為準確的結(jié)果。比如,谷歌的無人駕駛汽車牌照,利用傳感器、雷達、導航系統(tǒng)、數(shù)據(jù)地圖、實時街景數(shù)據(jù)和大數(shù)據(jù)分析等技術支撐無人駕駛車,這個精度要求面積,它通過大數(shù)據(jù)進行掃街掃出來的地圖,比百度地圖精確度高得多,這要求非常精密。
此外,大數(shù)據(jù)還可以提高分析精度。最近十年,語音識別錯誤率和機器翻譯的準確性都成倍改進,其中20%的貢獻來自方法的改進,80%則在于數(shù)據(jù)量的提升。傳統(tǒng)用OCR辦法識別文字的成功率到98%后就很難再提升,但通過大量收集已知文字的照片和圖片等用于比照,識別成功率提高到99.9%。
中國科學院院士、上海交通大學副校長梅宏:大數(shù)據(jù)發(fā)展亟須頂層規(guī)劃與示范引導
“現(xiàn)在許多非技術學科的領域也開始匯集在大數(shù)據(jù)的基礎之下,這無疑過熱了,大數(shù)據(jù)已經(jīng)成為各行各業(yè)爭取資源的‘馬甲’。”中國科學院院士、上海交通大學副校長梅宏在數(shù)博會“第一屆大數(shù)據(jù)科學與工程國際會議(2016)——大數(shù)據(jù)科學認識與理解”論壇上發(fā)表《對大數(shù)據(jù)熱潮的若干思考》主題演講時表示,目前大數(shù)據(jù)發(fā)展已出現(xiàn)炒作過熱的狀態(tài),應根據(jù)發(fā)展需求做好頂層設計和示范引導,審慎推進。
梅宏指出,目前,我們已進入大數(shù)據(jù)驅(qū)動的新時代?;仡欉^去,1995年以前是信息化1.0;2015年進入以聯(lián)網(wǎng)應用為特征的網(wǎng)絡化階段,即信息化2.0;現(xiàn)在已步入以數(shù)據(jù)的深度挖掘與融合應用為特征的智慧化階段,即信息化3.0。他認為,大數(shù)據(jù)作為一個現(xiàn)象的產(chǎn)生,是信息技術的不斷廉價化與互聯(lián)網(wǎng)及其延伸所帶來的無處不在的信息技術應用所產(chǎn)生的“自然現(xiàn)象”。
在梅宏看來,現(xiàn)在在商業(yè)智能、智能交通、自然語言處理、機器人等領域已有很多數(shù)據(jù)應用的成功案例,但很多仍處于初級發(fā)展階段,大數(shù)據(jù)不只是簡單地統(tǒng)計數(shù)據(jù),真正的大數(shù)據(jù)應用應該體現(xiàn)在數(shù)據(jù)挖掘的深度和多源跨界數(shù)據(jù)融合的廣度,絕不是數(shù)據(jù)的“海量”。
梅宏說,通過大數(shù)據(jù)構建一個數(shù)據(jù)空間,從樣本到全體、從精確到近似、從因果到關聯(lián)度,可以無限逼近我們的現(xiàn)實世界,根據(jù)大數(shù)據(jù)分析,可以對未來有所預見,從而影響政府的決策。但梅宏強調(diào),現(xiàn)在許多非技術學科的領域也開始匯集在大數(shù)據(jù)的基礎之下,無疑過熱了,大數(shù)據(jù)已經(jīng)成為各行各業(yè)爭取資源的“馬甲”。
梅宏認為,大數(shù)據(jù)的普遍應用將對社會產(chǎn)生重要影響,可能帶來數(shù)據(jù)所有權、隱私保護、信息安全等一系列新的問題,而相應的道德、法律建設、以及技術手段仍處于滯后狀態(tài)。他認為,大數(shù)據(jù)中心的投建要根據(jù)應用需求,做好頂層設計,積極謀劃并審慎推進。他指出,大數(shù)據(jù)正引發(fā)新一輪信息化建設新潮,亟須頂層規(guī)劃和示范引導,積極謀劃、謹慎推進,避免一哄而上,造成超前投資或重復投資。
美國俄亥俄州立大學教授張曉東:數(shù)據(jù)是檢驗真理的重要標準
“大數(shù)據(jù)讓我們更清晰地看到社會本質(zhì)和認識自身,從而致使違背規(guī)律和人的本性的決策大大減少。”昨日,美國俄亥俄州立大學的Robert M. Critchfield講座教授、計算機科學與工程系主任張曉東在數(shù)博會“第一屆大數(shù)據(jù)科學與工程國際會議(2016)——大數(shù)據(jù)科學認識與理解”論壇上發(fā)表《數(shù)據(jù)分析將對人類自身的了解達到前所未有的高度》主題演講。他說,今天大數(shù)據(jù)發(fā)展的原因與目的最終是為了人類社會發(fā)展,數(shù)據(jù)將成為檢驗真理的一個重要標準。
張曉東指出,首先,隨著計算機的不斷演進、數(shù)據(jù)量逐漸增大,數(shù)據(jù)處理也面臨諸多挑戰(zhàn)?;ヂ?lián)網(wǎng)和無線上網(wǎng)是數(shù)據(jù)世界的基礎,計算機到了今天的時代,已經(jīng)是一個數(shù)據(jù)中心,這個數(shù)據(jù)中心每天都會有龐大的數(shù)據(jù)進出。“而如此大的數(shù)據(jù)量,也對我們數(shù)據(jù)處理帶來很多新的挑戰(zhàn)。”張曉東指出,這兩個挑戰(zhàn)一是傳統(tǒng)的數(shù)據(jù)管理的商業(yè)模式不被日益增加的非盈利用戶所接受,通用的數(shù)據(jù)庫技術不能滿足大數(shù)據(jù)可擴展和高容錯的特殊需求;二是世界級的大公司必須擁有成功的通用軟件。
在張曉東看來,大數(shù)據(jù)分析是走向理性決策的重要基礎。大數(shù)據(jù)分析發(fā)展的最主要原因是從巨大、不規(guī)則和零散的數(shù)據(jù)中找到新知識,它可以提供完美科學的決策,消除感性、教條和口號式的決策,同時違背規(guī)律和人的本性的決策會大大減少。大數(shù)據(jù)分析的本質(zhì)不是數(shù)據(jù)量的大,而是分析結(jié)果的科學性。
張曉東以劃分我國人口密度的胡煥庸線舉例說,在過去,胡煥庸是通過非常簡陋的條件做大量的考察,才在1935年總結(jié)出了中國千年不變的人口分布。而現(xiàn)在,這條線的面積和人口比例已經(jīng)發(fā)生改變,其中原因我們已可以通過具體數(shù)據(jù)分析得到答案。同樣對比美國人口動態(tài)遷移,從1800到2010年,美國人口一直向西邊移動,尤其是西海岸,如今通過數(shù)據(jù)分析,我們可以了解到這與1862年頒布的法律有關,這些原因甚至人口遷移的條件、速度等分析都已可以通過大數(shù)據(jù)得來。
張曉東感嘆,上世紀90年代曾預測,互聯(lián)網(wǎng)的出現(xiàn)和完備將對整個工業(yè)生產(chǎn)和人類日常生活作出顛覆性的變化,而在今年我們知道,這些預測已經(jīng)全部應驗了。今天人們對大數(shù)據(jù)的分析,使人類對自身的了解與回答上升到了一個前所未有的高度,越來越多的普適價值將是以數(shù)據(jù)為基礎的,數(shù)據(jù)成為檢驗真理的一個重要標準。
清華大學數(shù)據(jù)科學研究院院長俞士綸:異構讓大數(shù)據(jù)實現(xiàn)更多價值
昨天,美國伊利諾伊大學芝加哥分校特聘主任教授、清華大學數(shù)據(jù)科學研究院院長俞士綸在數(shù)博會“第一屆大數(shù)據(jù)科學與工程國際會議——大數(shù)據(jù)科學認識與理解”論壇上發(fā)表《對異構數(shù)據(jù)源的思考》的演講。他說,大數(shù)據(jù)時代,數(shù)據(jù)可以改變很多細節(jié),我們要做的是找到有意義的數(shù)據(jù),并融合不同的數(shù)據(jù),將數(shù)據(jù)運用在實際的事情上。
俞士綸將數(shù)據(jù)庫比作藥品,將數(shù)據(jù)比作藥品的內(nèi)部結(jié)構。人們通過研究藥的內(nèi)部結(jié)構來預測這個藥的治療效果,但一個藥的內(nèi)部結(jié)構只是一些有限的資訊,如果我們制作兩個化學藥品都有相同的效果,那可以把這兩個內(nèi)部結(jié)構的資訊合到一起,這將會得到更好的結(jié)果。這就像如果我們把來自不同的領域的數(shù)據(jù)庫和數(shù)據(jù)聯(lián)在一起,我們就可利用數(shù)據(jù)做出更好的預測。
與這個比喻相似的是,豆瓣利用人們對于一個電影的喜愛程度,綜合這部電影和這個人以往看過電影的主演、導演、電影類型、人物性格等多種電影資訊就可以進行預測。但這種數(shù)據(jù)預測的效果又是因人而異的,有些人社交關系比較多,但有些人卻沒有什么朋友,所以數(shù)據(jù)的預測要通過不同的路徑,再進行預測,就會減少誤差。
俞士綸說,當這種方法應用在治療上,如一個人進行老年癡呆癥的檢查時,醫(yī)生不僅可以綜合他掃描的CT,還可以對他做的抽血檢查和以往病史等文字、圖片及影像材料進行綜合,將會得到更好的結(jié)果,這也是數(shù)據(jù)融合的例子。
在俞士綸看來,異構數(shù)據(jù)可能是一張圖和與之相關一段圖解,就是用兩個不同的方式來表達一件事。當我們從圖和文字找到相似的地方時,我們通過圖就可以找到相關的文字描述,通過文字描述,就可以找到相關的圖片。如果將兩者聯(lián)系在一起,結(jié)果就能更為準確。
俞士綸指出,現(xiàn)在是大數(shù)據(jù)時代,一個重要的事情是我們要怎樣融合不同的數(shù)據(jù)。比如氣象預測,光做預測是根本賺不了錢的,但如果應用在貨物運輸、農(nóng)業(yè)等具體領域,天氣的這些數(shù)據(jù)將可以改變很多細節(jié),提供更多便利,成為真正有價值的數(shù)據(jù)。所以,我們首先要了解到什么是有意義的數(shù)據(jù),然后如何把這些數(shù)據(jù)合在一起去提供更好的服務。
中國工程院院士方濱興:云監(jiān)控與云加密助力打造可信云
昨天,中國工程院院士方濱興在“第一屆大數(shù)據(jù)科學與工程國際會議(2016)——大數(shù)據(jù)科學認識與理解”論壇上發(fā)表了主旨演講。他認為,云監(jiān)控和云加密可以打造可信的云,保障云中數(shù)據(jù)安全,降低泄密風險。
方濱興指出,云安全分為四個層面,第一個是可靠的云,能夠始終可靠地提供服務,然后是安全云,保障用戶及租戶在云中不會因攻擊而受到損害。其次是,可信云,保障云服務商不會對租戶的運行進行侵害。然后是可控云,這個云本身,調(diào)動各種云的資源,保障租戶不會利用云來運算惡意程序。
在方濱興看來,大數(shù)據(jù)由云平臺進行存儲和處理,分工更細,另外,數(shù)據(jù)的所有權和管理權分離,這種分離將導致數(shù)據(jù)不可控,而云監(jiān)控與云加密可打造可信的云,云監(jiān)控可防止云服務商作惡,保障云中數(shù)據(jù)安全,云加密可降低泄密風險,無縫數(shù)據(jù)加密傳輸、支持任意云端平臺。
方濱興說,云加密是用戶自保式安全模式,首先它是主動加密,主動加密不亂化結(jié)構;其次是透明應用,云加密在操作過程不改變用戶習慣,可與應用無縫集成,不影響功能,屬于傻瓜式配置,可維護性強;最后,功能加密支持密文搜索和格式安全,通過云加密瀏覽看到的是正常的文章或圖片,未通過云加密瀏覽看到的是亂碼。
方濱興表示,云監(jiān)控與云加密具有增加了云管控與審計、多終端無縫介入,隨時進行操作、智能權限策略、精準指令控制、文化內(nèi)容審計、大數(shù)據(jù)分析、更高安全系統(tǒng)等多個特點,其中智能權限策略可以在用戶進行敏感操作時提出拒絕,而云管控與審計則具備對云平臺和虛擬機的安全加固能力。
相關閱讀:
“數(shù)博會”聽大咖說(六):互聯(lián)網(wǎng)時代的大數(shù)據(jù)安全與挑戰(zhàn)
來源:數(shù)據(jù)觀
刷新相關文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風起云涌時,共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風險感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
9#后疫情時代的新思考#構建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會丨《云MSP發(fā)展白皮書》重