AI和大數(shù)據(jù)襲來,卻增加創(chuàng)業(yè)者顛覆科技巨頭的難度
【數(shù)據(jù)猿導讀】 讓機器學習不再那么渴求數(shù)據(jù),這方面的進步有可能顛覆人工智能的數(shù)據(jù)經(jīng)濟學;優(yōu)步去年就收購了一家從事相關研究的公司。但現(xiàn)在,后者仍然有可能試著避開人工智能巨頭公司已有的數(shù)據(jù)優(yōu)勢。

隨著人工智能能和大數(shù)據(jù)的熱潮來臨,帶來了更所的科技創(chuàng)新的機遇與前景,但與此同時,也增加了初創(chuàng)者們顛覆大公司的機會……
新的一周,Google公開了一項在AI領域的破紀錄研究成果。該項研究成果揭示了一個重要的信息。傳統(tǒng)上我們認為,日益依賴消費者和社會經(jīng)濟的科技公司特征是創(chuàng)新和反壟斷的——這也是小企業(yè)可以顛覆大公司的機會所在。 然而當科技公司之間的競爭依賴于通過大數(shù)據(jù)進行的機器學習之時,小公司顛覆巨頭的道路將會變得更加艱難。
Google周一發(fā)布了他們與Carnegie Mellon大學一項不菲的合作。雙方的圖像識別實驗室在兩個月里整合了50個強大的圖形處理器,并使用了一個前所未有的3億張標記圖像(其他實驗室大部分都只使用百萬量級的圖片標準集合)。這個實驗的目的在于測試是否可以通過給計算機更大量的數(shù)據(jù),而不是通過調整算法來提高機器對圖片的識別率。
答案是可以。
Google和CMU的研究人員使用規(guī)模龐大的新數(shù)據(jù)集對一套標準的圖像處理系統(tǒng)進行訓練之后,發(fā)現(xiàn)系統(tǒng)在數(shù)項標準測試中得到了新的高分——這些測試目的在于在評估軟件解讀圖片的能力,比如識別照片中的物體。在他們輸入的數(shù)據(jù)量和圖像識別算法的準確性之間有著清晰的關系。這些發(fā)現(xiàn)在某種程度上解答了一個在人工智能學界流傳的問題,即即是否可以從現(xiàn)有的算法中獲得大量的數(shù)據(jù),從而進一步獲得更多的數(shù)據(jù)。
數(shù)據(jù)越多能產生更多的性能。這表明,像谷歌、Facebook或微軟這樣的數(shù)據(jù)豐富的科技巨頭,可能會有更大的好處。
圖像處理系統(tǒng)基于谷歌包含3億張圖片的巨大數(shù)據(jù)集進行學習,這并未產生巨大的好處——從100萬張圖片到3億張圖片,系統(tǒng)識別對象能力的得分僅僅提升了3個百分點——但論文作者表示,他們認為可以通過調整軟件更好地適應超大型數(shù)據(jù)集來擴大這種優(yōu)勢。
即便事實證明情況并非如此,但在科技行業(yè)當中,很小的優(yōu)勢也可能造成重要影響。比如,就自動駕駛汽車視覺技術的準確性來說,每一點增益都是至關重要的;而對一款能夠創(chuàng)收數(shù)十億美元的產品而言,小小的效率提升將能產生滾雪球效應。
在科技公司眼中,囤積數(shù)據(jù)已經(jīng)成為一種防御性策略。
谷歌、微軟和其他公司都開放了大量的軟件,甚至是硬件設計,但是對于這些工具的使用卻沒有那么大的自由??萍脊敬_實發(fā)布了數(shù)據(jù):去年,谷歌發(fā)布了一個龐大的數(shù)據(jù)集,從超過700萬的YouTube視頻中提取出來,而Salesforce則開放了一個從維基百科中提取的數(shù)據(jù),以幫助算法處理語言。
但是,人工智能發(fā)展實驗室的合作伙伴、勞倫斯伯克利國家實驗室的訪問研究員盧克德Oliveira說,(正如你所預料的那樣)這樣的發(fā)布通常不會給潛在的競爭對手提供太多的價值。他說:“這些數(shù)據(jù)從來都不是真正對產品市場地位至關重要的數(shù)據(jù)集。”
谷歌和CMU的研究人員表示,他們想要他們的最新研究成果,即他們所說的“海量數(shù)據(jù)”的價值,以促進更大的、谷歌規(guī)模的、開放的圖像數(shù)據(jù)集的創(chuàng)建。他們寫道:“我們真誠的希望是,這能激勵愿景社區(qū)不要低估數(shù)據(jù),并在構建更大數(shù)據(jù)集的過程中共同努力。”CMU的Abhinav Gupta說,一個選擇是與普通的視覺數(shù)據(jù)基金會合作,這是一個由Facebook和微軟贊助的非營利組織,它已經(jīng)發(fā)布了開放的圖像數(shù)據(jù)集。
與此同時,數(shù)據(jù)量小的公司想要在數(shù)據(jù)競爭中生存下來,他們需要自己的算法變得更聰明和更有創(chuàng)意。Jeremy Achin是初創(chuàng)公司DataRobot的首席執(zhí)行官,他猜測,隨著機器學習變得對越來越多的公司和行業(yè)舉足輕重,一種見于保險行業(yè)的模式可能在更大范圍內流行起來,即眾多小保險公司(認真地)把各自數(shù)據(jù)“拼”到一起,以使其風險預測能夠匹敵那些規(guī)模更大的競爭對手。
讓機器學習不再那么渴求數(shù)據(jù),這方面的進步有可能顛覆人工智能的數(shù)據(jù)經(jīng)濟學;優(yōu)步去年就收購了一家從事相關研究的公司。但現(xiàn)在,后者仍然有可能試著避開人工智能巨頭公司已有的數(shù)據(jù)優(yōu)勢。
來源:人人都是產品經(jīng)理
刷新相關文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關于醫(yī)
-
2數(shù)據(jù)軟件產品和服務商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風起云涌時,共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風險感知
-
7#榜樣的力量#內蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
10#后疫情時代的新思考#構建工業(yè)互聯(lián)網(wǎng)新