未來,搜狗輸入法的創(chuàng)新離不開大數(shù)據(jù)
【數(shù)據(jù)猿導讀】 搜狗輸入法的微創(chuàng)新“新詞收錄”產(chǎn)生的效果讓美國Oculus公司大吃一驚。這個基于搜狗輸入法樣本量足夠大的情況之下,這種通過深度廣度標準收錄新詞的方式具備了相當大的客觀性和準確性。新詞錄入的微創(chuàng)新復合大數(shù)據(jù)時代的趨勢,未來搜狗的創(chuàng)新更加離不開大數(shù)據(jù)

進入在中國不到3個月的美國VR公司Oculus發(fā)現(xiàn),通過搜狗輸入法輸入公司的英文名稱,就可以在搜狗輸入法的中文鍵盤內(nèi)躍然而出,而不在需要進行中英文鍵盤的切換。據(jù)說,這令Oculus公司很吃驚。
其實這是搜狗輸入法的微創(chuàng)新——“新詞收錄”所產(chǎn)生的效果。搜狗輸入法現(xiàn)在通過算法來判斷是否收錄一個新詞進入詞庫,它是從這個新詞爆發(fā)的廣度和深度去判斷和計算的:廣度就是有多少人開始輸入這個完整的單次,深度是用戶輸入這一新詞的頻率是多少。
這個基于搜狗輸入法樣本量足夠大的情況之下,這種通過深度廣度標準收錄新詞的方式具備了相當大的客觀性和準確性——因此,換個角度思考,不論是中資還是外資企業(yè),看看名字何時被完整收入詞庫,也是拿來判斷其推廣營銷或者業(yè)務是否成功的一個標準。
微創(chuàng)新產(chǎn)生的經(jīng)濟效益
被收錄入搜狗輸入法后,一個新詞,尤其外文詞匯,第一個好處其實是為用戶節(jié)省了大量的時間,也提高了溝通效率。如果這個詞匯在搜狗輸入法中被輸入的深度廣度足夠,一旦鍵入縮寫,與之相關(guān)的詞匯就能自動被列出,輸入速度和方便程度都能被極大提高。
這就是輸入法上的微創(chuàng)新,不要小看這類功能設(shè)置上給用戶帶來的一點點便利——它背后有堅實的技術(shù)基礎(chǔ)。搜狗輸入法的這類微創(chuàng)新非常類似2004年夏天由谷歌一個工程師凱文-吉布斯發(fā)明的“Google Suggest”搜索建議模型,用戶查找天氣預報(weather forecast)時,只要輸入we,谷歌就自動推測搜索結(jié)果,并給一個下拉列表,讓用戶不用全部輸入就能點擊完整的查詢請求。現(xiàn)在這類創(chuàng)新模式已經(jīng)改變了全球幾十億人的使用習慣,每次搜索過程都能夠為用戶節(jié)省幾十秒時間,全球的谷歌用戶每天能夠因此節(jié)省幾千萬個小時。
同理,搜狗輸入法的使用頻次可比谷歌搜索頻次高很多,通過通過新詞收錄這個微創(chuàng)新,7億用戶平均每天就可以節(jié)省高達百萬個小時,大幅度提高了線上溝通的效率,也節(jié)省了大量用戶的時間——這兩者相加,就是微創(chuàng)新的經(jīng)濟效益。
新詞錄入也是市場推廣的微創(chuàng)新
人們對于新事物的認知需要時間,無論公司、平日很少涉及的概念或者詞匯。傳統(tǒng)的推廣模式,是需要投放大量廣告不斷刷存在感才可讓用戶對新事物產(chǎn)生印象,讓提及率得到提高。這樣的模式需要大量的廣告創(chuàng)意支撐,并且伴隨多種渠道的廣告投放,自然要花很多錢——但效果如何卻未可知。
所以很多中國本土品牌會處心積慮想出不少諧音和容易記的名字與廣告詞,外國公司則必須選擇本地化的道路,但這仍舊需要金錢和時間的積累。
但如果一個廣告營銷人,能夠微創(chuàng)新地把搜狗輸入法新詞當做一個推廣模式的話,那么其實用戶只需要對前幾次字母或者大概的名稱有印象,則品牌詞的全稱就會在輸入法上躍然而出,立即呈現(xiàn),一次又一次在用戶輸入界面上刷新“存在感。”
未來的創(chuàng)新將依賴大數(shù)據(jù)進行
搜狗的這種不斷從用戶使用行為和頻次中進行微創(chuàng)新的做法,是符合大數(shù)據(jù)時代的趨勢的。
事實上,早在過去的十幾年里,微軟都在依靠自身的力量去對Word系統(tǒng)里的查找拼寫錯誤功能來進行維護,他們會依靠不斷更新的字典去改進Word的拼寫——如果Word系統(tǒng)不及時根據(jù)字典更新,就會將用戶的一些詞匯判斷為拼寫錯誤。過去,微軟為此每年要花費數(shù)百萬美元。
但是讓我們來看看谷歌在互聯(lián)網(wǎng)環(huán)境下是怎么做的,谷歌靠每天處理的幾十億查詢中輸入搜索框里的錯誤拼寫,給用戶提供了一個巧妙的反饋系統(tǒng)。當用戶拼錯字的時候,谷歌會顯示出:“你要找的是不是流行病學”這樣的反饋,讓用戶重新點擊,明確自己要查詢的內(nèi)容,這樣的做法比方便用戶更有意義,因為隨著這個系統(tǒng)的不斷完善,即使用戶輸入不精確的內(nèi)容也能獲得正確結(jié)果。
就這樣,通過大數(shù)據(jù)、交互和算法,谷歌獲得了一個免費的拼寫檢查。
而搜狗現(xiàn)在在輸入法上的創(chuàng)新,例如細胞詞庫,也是基于以上這幾個原則與基礎(chǔ)。細胞詞庫是搜狗首創(chuàng)的、開放共享、可在線升級的細分化詞庫的功能,它可以根據(jù)用戶的輸入習慣滿足對方的個性化和極細類別詞匯的輸入,而這些詞是源于搜狗搜索引擎不斷更迭的熱門關(guān)鍵詞——真正的聰明的公司總是能夠利用這些數(shù)據(jù)以改善現(xiàn)有的服務或開發(fā)新服務。
正如《大數(shù)據(jù)時代》一書中所說,數(shù)據(jù)利用可以非常巧妙,微小的交互、反饋就像碎屑,但如果能夠被收集在一起,“就能鍛造成一塊閃亮的金元寶”。
來源:經(jīng)理人分享
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計算機網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風起云涌時,共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風險感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
9#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會丨《云MSP發(fā)展白皮書》重