AI和大數(shù)據(jù) 讓科技公司的地位比從前更難撼動
IT耳朵 | 2017-07-25 08:35
【數(shù)據(jù)猿導(dǎo)讀】 消費者生活和經(jīng)濟體發(fā)展越來越依賴科技進步,而科技公司的生態(tài)體系則依靠小公司不斷顛覆大公司來實現(xiàn)不斷創(chuàng)新和非壟斷。但當(dāng)科技競爭涉及到由大數(shù)據(jù)庫驅(qū)動的機器學(xué)習(xí)時,大科技公司的地位將比從前更難以撼動。

在新的一周里,谷歌發(fā)布了一項新的AI調(diào)查研究,這項研究再次彰顯當(dāng)今AI事業(yè)蓬勃發(fā)展的強勢勁頭。消費者生活和經(jīng)濟體發(fā)展越來越依賴科技進步,而科技公司的生態(tài)體系則依靠小公司不斷顛覆大公司來實現(xiàn)不斷創(chuàng)新和非壟斷。但當(dāng)科技競爭涉及到由大數(shù)據(jù)庫驅(qū)動的機器學(xué)習(xí)時,大科技公司的地位將比從前更難以撼動。
這項新研究由谷歌同卡內(nèi)基梅隆大學(xué)(Carnegie Mellon University)投入大量資金一起合作完成,于周一公布了預(yù)印版。谷歌同CMU 大學(xué)花了整整兩個月時間將50個圖像識別器連接到一起,并采集了3億標(biāo)識過的圖片。此項目的目的是檢驗在不調(diào)整算法而是進行大量數(shù)據(jù)輸入的情況下,機器能否更準確的識別圖像。
答案是肯定的。 Google和CMU的研究人員對新的數(shù)據(jù)庫進行了一個標(biāo)準的圖像處理系統(tǒng)培訓(xùn)之后,他們表示機器在圖像識別相關(guān)的標(biāo)準測試(如發(fā)現(xiàn)圖中的物體)中獲得了新的進展。顯然輸入數(shù)據(jù)的量和圖像識別的準確度之間有直接關(guān)系。這項發(fā)現(xiàn)明確了之前關(guān)于AI界能否在維持下現(xiàn)有算法、只增加數(shù)據(jù)輸入的條件下獲得更多產(chǎn)出的問題。
由此發(fā)現(xiàn)可看出像谷歌、臉書和微軟這種數(shù)據(jù)巨頭公司,通過大數(shù)據(jù)的支持,會比之前預(yù)想的收益更大。谷歌3億圖像的數(shù)據(jù)庫并不能產(chǎn)出巨大利潤。圖像數(shù)據(jù)庫從1百萬增長到3億多帶來的識別精度增長只有3%。但此次研究論文的作者表示他們認為可以通過將軟件調(diào)整到更適合超大數(shù)據(jù)庫的方式來擴大優(yōu)勢。即使最終這一預(yù)期沒能達成,但在科技界,一點小優(yōu)勢也十分重要。舉個例子,在無人駕駛汽車中,視覺識別精準就特別關(guān)鍵。對于某些產(chǎn)品而言,哪怕只有絲毫的性能優(yōu)化,也能快速的帶來幾十億的收入增長。
囤積數(shù)據(jù)早已是以AI為主要業(yè)務(wù)公司的防御策略。像谷歌、微軟這樣的公司都已開放軟件甚至是硬件的源碼,但對能使這些工具有用的支撐數(shù)據(jù)卻并沒有這么開放。但也不是說數(shù)據(jù)不開放:去年,谷歌公開了從700多萬YouTube 視頻中采集的數(shù)據(jù);Salesforce 也開放了從維基百科中收集的數(shù)據(jù)庫,方便算法可在各語言中使用。針對這些開放數(shù)據(jù),來自AI開發(fā)實驗室Manifold的合伙人盧克·德·奧利維拉(Luke de Oliveira)和勞倫斯伯克利國家實驗室(Lawrence Berkeley National Lab)的訪問研究員表示(想必大家也想到了),這種公開的數(shù)據(jù)庫通常對潛在競爭對手而言價值并不高。“這種數(shù)據(jù)庫絕不是那種對產(chǎn)品后續(xù)市場定位有關(guān)鍵影響的數(shù)據(jù)庫。”
谷歌和CMU的研究人員表示,他們希望他們最新的研究、所謂的“大數(shù)據(jù)”的價值,能催化創(chuàng)建處更大的、Google規(guī)模的開放圖像數(shù)據(jù)庫。他們寫道:“我們真誠地希望這能激發(fā)視覺界的人員不要低估數(shù)據(jù),并開發(fā)集體努力來構(gòu)建更大的數(shù)據(jù)集”。負責(zé)研究的CMU的Abhinav Gupta表示,想實現(xiàn)這一點,一個可行的選擇是與通用視覺數(shù)據(jù)基金會(Common Visual Data Foundation)合作,這是由Facebook和微軟發(fā)起的非營利組織,該公司已經(jīng)發(fā)布了開放圖像數(shù)據(jù)集。
同時,數(shù)據(jù)匱乏的公司想要在持有豐富數(shù)據(jù)的科技巨頭公司間生存下去,則更需要創(chuàng)新意識。 DataRobot公司首席執(zhí)行官Jeremy Achin表示,機器學(xué)習(xí)對更多公司和行業(yè)而言越發(fā)重要,小型公司(認真地)將數(shù)據(jù)集中在一起,使其風(fēng)險預(yù)測與較大競爭對手競爭的保險模式可能會受到更廣泛的關(guān)注。
使機器學(xué)習(xí)更少的依靠數(shù)據(jù)的進步可以提高AI的數(shù)據(jù)經(jīng)濟性; Uber去年收購了一家從事該項目的公司。但是現(xiàn)在也可以嘗試并回避AI傳統(tǒng)運營商通常的數(shù)據(jù)優(yōu)勢。Fast.ai,一家致力于使機器學(xué)習(xí)更大眾化的公司,其聯(lián)合創(chuàng)始人雷切爾·托馬斯(Rachel Thomas)表示,初創(chuàng)公司可以在互聯(lián)網(wǎng)巨頭很少涉及的產(chǎn)業(yè)(如農(nóng)業(yè))展開機器學(xué)習(xí)。“我不確定這些大公司是不是在所有行業(yè)都那么有優(yōu)勢。在很多領(lǐng)域,并沒有去收集相關(guān)數(shù)據(jù)”。即使人工智能巨頭公司也有未涉及的盲點區(qū)域。
來源: IT耳朵
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
10#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新