AI和大數(shù)據(jù)襲來，卻增加創(chuàng)業(yè)者顛覆科技巨頭的難度

大數(shù)據(jù) 創(chuàng)業(yè) 科技

人人都是產品經(jīng)理 | 2017-07-26 08:39

【數(shù)據(jù)猿導讀】讓機器學習不再那么渴求數(shù)據(jù)，這方面的進步有可能顛覆人工智能的數(shù)據(jù)經(jīng)濟學;優(yōu)步去年就收購了一家從事相關研究的公司。但現(xiàn)在，后者仍然有可能試著避開人工智能巨頭公司已有的數(shù)據(jù)優(yōu)勢。

AI和大數(shù)據(jù)襲來，卻增加創(chuàng)業(yè)者顛覆科技巨頭的難度

隨著人工智能能和大數(shù)據(jù)的熱潮來臨，帶來了更所的科技創(chuàng)新的機遇與前景，但與此同時，也增加了初創(chuàng)者們顛覆大公司的機會……

新的一周，Google公開了一項在AI領域的破紀錄研究成果。該項研究成果揭示了一個重要的信息。傳統(tǒng)上我們認為，日益依賴消費者和社會經(jīng)濟的科技公司特征是創(chuàng)新和反壟斷的——這也是小企業(yè)可以顛覆大公司的機會所在。然而當科技公司之間的競爭依賴于通過大數(shù)據(jù)進行的機器學習之時，小公司顛覆巨頭的道路將會變得更加艱難。

Google周一發(fā)布了他們與Carnegie Mellon大學一項不菲的合作。雙方的圖像識別實驗室在兩個月里整合了50個強大的圖形處理器，并使用了一個前所未有的3億張標記圖像(其他實驗室大部分都只使用百萬量級的圖片標準集合)。這個實驗的目的在于測試是否可以通過給計算機更大量的數(shù)據(jù)，而不是通過調整算法來提高機器對圖片的識別率。

答案是可以。

Google和CMU的研究人員使用規(guī)模龐大的新數(shù)據(jù)集對一套標準的圖像處理系統(tǒng)進行訓練之后，發(fā)現(xiàn)系統(tǒng)在數(shù)項標準測試中得到了新的高分——這些測試目的在于在評估軟件解讀圖片的能力，比如識別照片中的物體。在他們輸入的數(shù)據(jù)量和圖像識別算法的準確性之間有著清晰的關系。這些發(fā)現(xiàn)在某種程度上解答了一個在人工智能學界流傳的問題，即即是否可以從現(xiàn)有的算法中獲得大量的數(shù)據(jù)，從而進一步獲得更多的數(shù)據(jù)。

數(shù)據(jù)越多能產生更多的性能。這表明，像谷歌、Facebook或微軟這樣的數(shù)據(jù)豐富的科技巨頭，可能會有更大的好處。

圖像處理系統(tǒng)基于谷歌包含3億張圖片的巨大數(shù)據(jù)集進行學習，這并未產生巨大的好處——從100萬張圖片到3億張圖片，系統(tǒng)識別對象能力的得分僅僅提升了3個百分點——但論文作者表示，他們認為可以通過調整軟件更好地適應超大型數(shù)據(jù)集來擴大這種優(yōu)勢。

即便事實證明情況并非如此，但在科技行業(yè)當中，很小的優(yōu)勢也可能造成重要影響。比如，就自動駕駛汽車視覺技術的準確性來說，每一點增益都是至關重要的;而對一款能夠創(chuàng)收數(shù)十億美元的產品而言，小小的效率提升將能產生滾雪球效應。

在科技公司眼中，囤積數(shù)據(jù)已經(jīng)成為一種防御性策略。

谷歌、微軟和其他公司都開放了大量的軟件，甚至是硬件設計，但是對于這些工具的使用卻沒有那么大的自由?？萍脊敬_實發(fā)布了數(shù)據(jù)：去年，谷歌發(fā)布了一個龐大的數(shù)據(jù)集，從超過700萬的YouTube視頻中提取出來，而Salesforce則開放了一個從維基百科中提取的數(shù)據(jù)，以幫助算法處理語言。

但是，人工智能發(fā)展實驗室的合作伙伴、勞倫斯伯克利國家實驗室的訪問研究員盧克德Oliveira說，(正如你所預料的那樣)這樣的發(fā)布通常不會給潛在的競爭對手提供太多的價值。他說:“這些數(shù)據(jù)從來都不是真正對產品市場地位至關重要的數(shù)據(jù)集。”

谷歌和CMU的研究人員表示，他們想要他們的最新研究成果，即他們所說的“海量數(shù)據(jù)”的價值，以促進更大的、谷歌規(guī)模的、開放的圖像數(shù)據(jù)集的創(chuàng)建。他們寫道:“我們真誠的希望是，這能激勵愿景社區(qū)不要低估數(shù)據(jù)，并在構建更大數(shù)據(jù)集的過程中共同努力。”CMU的Abhinav Gupta說，一個選擇是與普通的視覺數(shù)據(jù)基金會合作，這是一個由Facebook和微軟贊助的非營利組織，它已經(jīng)發(fā)布了開放的圖像數(shù)據(jù)集。

與此同時，數(shù)據(jù)量小的公司想要在數(shù)據(jù)競爭中生存下來，他們需要自己的算法變得更聰明和更有創(chuàng)意。Jeremy Achin是初創(chuàng)公司DataRobot的首席執(zhí)行官，他猜測，隨著機器學習變得對越來越多的公司和行業(yè)舉足輕重，一種見于保險行業(yè)的模式可能在更大范圍內流行起來，即眾多小保險公司(認真地)把各自數(shù)據(jù)“拼”到一起，以使其風險預測能夠匹敵那些規(guī)模更大的競爭對手。

讓機器學習不再那么渴求數(shù)據(jù)，這方面的進步有可能顛覆人工智能的數(shù)據(jù)經(jīng)濟學;優(yōu)步去年就收購了一家從事相關研究的公司。但現(xiàn)在，后者仍然有可能試著避開人工智能巨頭公司已有的數(shù)據(jù)優(yōu)勢。

來源：人人都是產品經(jīng)理

收藏分享

聲明：數(shù)據(jù)猿尊重媒體行業(yè)規(guī)范，相關內容都會注明來源與作者；轉載我們原創(chuàng)內容時，也請務必注明“來源：數(shù)據(jù)猿”與作者名稱，否則將會受到數(shù)據(jù)猿追責。