知人知面需知心:論人工智能技術(shù)在推薦系統(tǒng)中的應(yīng)用
【數(shù)據(jù)猿導(dǎo)讀】 本文嘗試從歷史的角度,剖析人工智能技術(shù)在推薦系統(tǒng)中的應(yīng)用,探索前沿課題以及未來的發(fā)展方向,讓讀者能夠了解到技術(shù)發(fā)展的宏觀過程

在電子商務(wù)、個性化閱讀、社交網(wǎng)絡(luò)(媒體)以及共享經(jīng)濟(jì)高速發(fā)展的今天,發(fā)現(xiàn)用戶的需求、了解用戶的行為并為用戶篩選出最相關(guān)的信息和產(chǎn)品已經(jīng)是互聯(lián)網(wǎng)服務(wù)的一個核心環(huán)節(jié)。
互聯(lián)網(wǎng)上的信息是海量的:YouTube用戶每分鐘上傳超過400小時的視頻;微信上超過1000萬個公眾賬號每天產(chǎn)生豐富的自媒體容;Instagram用戶每天貼出超過800萬照片;Snapchat用戶每天生成5億多“故事”(Story),全部看完需要158年……類似的例子數(shù)不勝數(shù)。因此,在幫助用戶尋找信息,幫助服務(wù)商尋找客戶的環(huán)節(jié),推薦系統(tǒng)扮演了舉足輕重的地位。
一方面,推薦系統(tǒng)從互聯(lián)網(wǎng)應(yīng)用的配角成為了諸如雅虎、LinkedIn和Netflix等大型網(wǎng)站的主角,為用戶和系統(tǒng)交互提供各類個性化服務(wù)。時至今日,已經(jīng)很難想象一個新的互聯(lián)網(wǎng)應(yīng)用沒有利用推薦系統(tǒng)來優(yōu)化用戶體驗(yàn)。
另一方面,從早期的協(xié)同過濾(Collaborative Filtering)算法到由Netflix大賽所推動的隱語義模型(Latent Factor Models),再到更加復(fù)雜的深度學(xué)習(xí)模型,推薦系統(tǒng)的技術(shù)已經(jīng)在過去十多年里有了長足的進(jìn)步。推薦系統(tǒng)的最終目標(biāo)也從準(zhǔn)確預(yù)測用戶的喜好,逐漸演變成在用戶、模塊以及系統(tǒng)中達(dá)到動態(tài)平衡,使得整個系統(tǒng)健康運(yùn)行。
本文嘗試從歷史的角度,剖析 人工智能技術(shù) 在推薦系統(tǒng)中的應(yīng)用,探索前沿課題以及未來的發(fā)展方向,讓讀者能夠了解到技術(shù)發(fā)展的宏觀過程。
“人工”和“非智能”時代
在算法及模型在推薦系統(tǒng)領(lǐng)域占有統(tǒng)治地位之前,據(jù)有領(lǐng)域知識(Domain Knowledge)的專業(yè)編輯往往充當(dāng)“人工推薦系統(tǒng)”的角色,主觀選擇并推送出用戶可能喜歡的內(nèi)容。“人工推薦”的好處在于能夠高質(zhì)量地定制內(nèi)容。很多傳統(tǒng)內(nèi)容媒體(如《紐約時報(bào)》、《華爾街日報(bào)》)的核心競爭力就是依靠一批高水平編輯精心撰寫和推薦內(nèi)容,從而能夠常年吸引了大批訂戶。
今天,微信公眾號所呈現(xiàn)出的自媒體現(xiàn)象,本質(zhì)上也是“人工推薦”在移動互聯(lián)網(wǎng)時期的再次蓬勃發(fā)展。后來,一些優(yōu)秀推薦系統(tǒng),比如雅虎首頁的“今日模塊”(Today Module),將“人工”和“機(jī)器算法”相結(jié)合,在編輯們每天優(yōu)選出一百篇左右高質(zhì)量文章的基礎(chǔ)上,由系統(tǒng)采用“聯(lián)系上下文的多臂老虎機(jī)”(Contextual Multi-Armed Bandit)算法平衡Exploitation與Exploration,極大地提升了推薦效果。由此可見,“人工”和“機(jī)器算法”的協(xié)調(diào)使用常常能夠彌補(bǔ)彼此的不足。
實(shí)際上,早期的推薦系統(tǒng)更多依靠一些從直覺引導(dǎo)出的簡單模型或者算法。
比如基于信息檢索(Information Retrieval)的推薦思路,把用戶信息當(dāng)作是查詢詞組(Query),用各類信息來把待推薦物品(Item)表達(dá)成“文檔”(Document)。于是,推薦最相關(guān)的一組物品的問題就被轉(zhuǎn)換成了信息檢索里的尋找最相關(guān)文檔的問題。
再比如,早期的協(xié)同過濾算法有兩個核心思路。
其一,就是為一個用戶A找到一群類似的用戶,從這些類似的用戶里尋找可以推薦的物品;
其二,就是兩個用戶都喜愛物品A,那么系統(tǒng)就把原本只有其中一個用戶喜歡的物品B推薦給另一個用戶。
后面這個思路常常被稱為Item-Item協(xié)同過濾,是非 人工智能 時代行之有效的推薦算法,也是亞馬遜(Amazon)購物系統(tǒng)早期使用的經(jīng)典算法。
“人工”或“非智能”推薦的一些弊端讓它們已不能適應(yīng)現(xiàn)代互聯(lián)網(wǎng)應(yīng)用的需求。比如,這兩種方案都很難明確“優(yōu)化目標(biāo)”。推薦的效果只能通過長期的經(jīng)驗(yàn)獲取而不能有一個系統(tǒng)的方法論來引導(dǎo)系統(tǒng)不斷進(jìn)步。其次,一個成熟的推薦系統(tǒng)需要考慮很多復(fù)雜的因素,如時間因素、突發(fā)事件因素或者新用戶、新物品因素,而這兩種方案都無法把諸多方面的因素系統(tǒng)性地糅合到推薦結(jié)果中去。因此,使用更加靈活的框架來解決推薦問題成為了很多工程師和研究者在21世紀(jì)最初幾年的一大課題。
機(jī)器學(xué)習(xí)時代
2006年到2009年的Netflix Prize大賽在推薦系統(tǒng)的發(fā)展史上是一次里程碑式的事件。為了方便競賽,Netflix把推薦電影的問題簡化為預(yù)測電影評分的準(zhǔn)確度,為方便應(yīng)用 人工智能 技術(shù)提供了臺階。這次大賽至少為推薦系統(tǒng)的長遠(yuǎn)發(fā)展帶來了三個成果。而這三個成果都與人工智能的子領(lǐng)域機(jī)器學(xué)習(xí)有著密切關(guān)系。
第一個成果 ,就是以矩陣分解(Matrix Factorization)為基礎(chǔ)的機(jī)器學(xué)習(xí)算法最后脫穎而出,贏得了冠軍。
矩陣分解的成功主要有三個方面的原因:
第一,觀測到的評分矩陣(Rating Matrix)過于稀疏,采取“降維表示”(Dimension Reduction)能夠有效地增強(qiáng)模型的“泛化能力”(Generalization);
第二,把用戶的評分分解成為用戶偏好向量和物品偏好向量的點(diǎn)積,直觀易懂;
第三,分解的目標(biāo)函數(shù)直接優(yōu)化評分準(zhǔn)確度,從而能夠更好地利用大量數(shù)據(jù),優(yōu)化得到用戶和物品偏好。
在此基礎(chǔ)上,矩陣分解框架也很容易加入各種建模元素,使得模型能夠更加充分地表達(dá)數(shù)據(jù)。
因此,矩陣分解以及其更廣義的形式隱語義模型成為了此后多年推薦系統(tǒng)研究的有力武器。數(shù)年之間學(xué)術(shù)界和工業(yè)界產(chǎn)生了數(shù)百篇關(guān)于這個方向的研究成果,并且多個頂級學(xué)術(shù)會議的最佳論文都授予這類模型的相關(guān)應(yīng)用。
第二個成果 ,就是機(jī)器學(xué)習(xí)的另一個工具——集成學(xué)習(xí)(Ensemble Learning)被各參賽隊(duì)伍廣泛地應(yīng)用于提高參賽成績。集成學(xué)習(xí)的基本思路是學(xué)習(xí)多個不同的模型(或相同模型的不同參數(shù)),然后再學(xué)習(xí)另外一層模型來融合不同底層模型之間的預(yù)測結(jié)果。這個方法的流行使得參賽隊(duì)伍在關(guān)注單個模型效果的同時,也開始探索如何能夠更有效地利用優(yōu)勢互補(bǔ)的不同模型,從而達(dá)到整體更優(yōu)。這一思路也在工業(yè)界推薦系統(tǒng)中得以發(fā)揚(yáng)光大。
比如,一些復(fù)雜的子系統(tǒng)往往只負(fù)責(zé)推薦結(jié)果的某一方面,而最后整體系統(tǒng)則由一個相對簡單的模型來學(xué)習(xí)各個子系統(tǒng)之間的結(jié)果融合。較為典型的實(shí)際系統(tǒng)應(yīng)用是Facebook對“新聞流”(News Feed)的建模:底層采用各個子系統(tǒng)所收集的信號,然后通過Gradient Boosted Decision Tree(GBDT)學(xué)習(xí)高層次的特性,最后用簡單的線性模型學(xué)習(xí)高層次特性的組合??偠灾?,集成學(xué)習(xí)在Netflix大賽之后成為了機(jī)器學(xué)習(xí)在推薦領(lǐng)域乃至整個數(shù)據(jù)科學(xué)領(lǐng)域非常重要的工具。
第三個成果 ,則是各類推薦系統(tǒng)大賽在Netflix大賽之后陸陸續(xù)續(xù)舉辦,進(jìn)一步吸引各方研究人員投入到改進(jìn)推薦系統(tǒng)算法和實(shí)踐的工作中,甚至不久之后催生了專業(yè)的數(shù)據(jù)科學(xué)比賽公司Kaggle。而數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)類的頂級會議KDD在2011年和2012年連續(xù)兩年舉辦的KDD Cup比賽的主題均與推薦系統(tǒng)有關(guān),這一舉動把以推薦系統(tǒng)為背景的數(shù)據(jù)科學(xué)比賽推向了高潮。
除了這三個成果以外,在這段時期,推薦系統(tǒng)的研究和開發(fā)還有三個趨勢。
第一,隱語義模型與復(fù)雜的概率圖模型(Probabilistic Graphical Model)特別是話題模型(Topic Model)結(jié)合起來,能夠把現(xiàn)實(shí)問題中的各類假設(shè)方便地設(shè)計(jì)到模型中去。這類模型的一大優(yōu)勢是既可以做評分預(yù)測,又可以同時對文本內(nèi)容建模,使得通過內(nèi)容來進(jìn)行推薦的效果得到較大提升。此方向代表作有話題模型的領(lǐng)軍人物、哥倫比亞大學(xué)統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)教授David Blei的學(xué)生Chong Wang的KDD 2011最佳論文。
第二 ,推薦系統(tǒng)和信息檢索特別是Learning To Rank技術(shù)的結(jié)合,為直接優(yōu)化返回結(jié)果列表而不是預(yù)測單個物品的評分提供了可能性。這方面的代表作有卡內(nèi)基梅隆大學(xué)教授Alex Smola等人在NIPS 2007年發(fā)表的CofiRank以及Steffen Rendle在UAI 2009年發(fā)表的BPR。
第三 ,因?yàn)閼?yīng)用場景的需要,張量分解(Tensor Factorization)、多矩陣協(xié)同分解(Collective Matrix Factorization)以及分解機(jī)(Factorization Machine)等技術(shù)先后被開發(fā)出來。這類模型的特點(diǎn)是它們都嘗試在一個通用的框架下把更多元化的信息融合進(jìn)來,使得推薦結(jié)果能夠基于除了評分以外更為廣闊的數(shù)據(jù)。
除此以外,推薦系統(tǒng)技術(shù)也與社交媒體、多媒體數(shù)據(jù)如圖像、音頻和視頻結(jié)合,成為了互聯(lián)網(wǎng)信息提供商的基礎(chǔ)設(shè)施。
準(zhǔn)人工智能時代
機(jī)器學(xué)習(xí)時代推薦系統(tǒng)研發(fā)的核心是如何提高針對單一問題的算法方案的準(zhǔn)確度,而忽視了人機(jī)交互的時間性和系統(tǒng)性,從而很難對變幻莫測的用戶行為以及瞬息萬變的外部環(huán)境進(jìn)行完整的建模。典型問題之一就是推薦系統(tǒng)容易產(chǎn)生千篇一律的結(jié)果。
比如,一個用戶喜歡娛樂新聞,于是推薦系統(tǒng)就反復(fù)推薦娛樂類文章;另一個用戶平時不那么關(guān)注足球,在世界杯期間了解了一些比賽結(jié)果,系統(tǒng)就誤以為這個用戶喜歡足球,從而開始推薦類似信息。雖然不少學(xué)者和工程師都嘗試在經(jīng)典的框架下通過改進(jìn)算法來規(guī)避這些因素以提高推薦結(jié)果的質(zhì)量,但本質(zhì)上,基于監(jiān)督學(xué)習(xí)(Supervised Learning)的大多數(shù)推薦模型都很難徹底解決這類問題。人工智能在推薦系統(tǒng)領(lǐng)域應(yīng)用的重要任務(wù),就是把推薦系統(tǒng)不再看作是一次一次推薦結(jié)果的運(yùn)行片段,而當(dāng)做是一個人機(jī)交互的整體行為,從而在時間維度上達(dá)到系統(tǒng)和用戶的動態(tài)優(yōu)化。
在這方面探索的一個主要研究方向與Netflix大賽幾乎同時期開始。當(dāng)時在雅虎研究院工作的John Langford、Lihong Li和Deepak Agarwal開始探索如何把人工智能技術(shù)的另一方向——強(qiáng)化學(xué)習(xí)(Reinforcement Learning)的一些算法應(yīng)用到推薦系統(tǒng)的場景中來。強(qiáng)化學(xué)習(xí)和監(jiān)督學(xué)習(xí)的最大區(qū)別在于,強(qiáng)化學(xué)習(xí)算法常常代表一個“回路系統(tǒng)”(Feedback System),用戶和系統(tǒng)通過交互來達(dá)到某個目標(biāo)的最優(yōu)化。系統(tǒng)和用戶的交互流程,不再是“一錘子買賣”,而是在時間的維度上通過一系列結(jié)果,來達(dá)到一個系統(tǒng)與用戶的動態(tài)平衡。
前面提到的雅虎首頁“今日模塊”的推薦工作就較早采用了強(qiáng)化學(xué)習(xí)。
最開始的模型是一個簡單的“多臂老虎機(jī)”(Multi-armed Bandit)算法Epsilon-Greedy,對于每個頁面請求,系統(tǒng)以較大的概率選擇當(dāng)前點(diǎn)擊率最高的文章顯示給用戶,而以較小的概率隨機(jī)在一百多篇文章中選擇一篇來顯示。Epsilon-Greedy的優(yōu)點(diǎn)是非常容易實(shí)現(xiàn),也和很多在線系統(tǒng)的A/B Testing環(huán)境吻合,所以至今仍然是簡單情況下做強(qiáng)化學(xué)習(xí)的首選。
后來,Epsilon-Greedy被一類特定的“聯(lián)系上下文的多臂老虎機(jī)”算法LinUCB所取代。LinUCB的基本思想是對每個文章的點(diǎn)擊率的估計(jì)及其置信區(qū)間同時建模,然后每次選擇點(diǎn)擊率的估計(jì)值與其標(biāo)準(zhǔn)差的和最大的那個文章。于是LinUCB能夠較好地平衡顯示用戶已經(jīng)喜歡的某類文章和對其他沒怎么看過的類別的文章,從而引導(dǎo)用戶對未知類別的探索。
在實(shí)際系統(tǒng)中,LinUCB比Epsilon-Greedy表現(xiàn)出了更加穩(wěn)定的效果,之后成為雅虎諸多推薦系統(tǒng)中的基準(zhǔn)系統(tǒng)(Baseline)。Deepak Agarwal從雅虎跳槽到LinkedIn之后則更進(jìn)一步,使用基于貝葉斯方法(Bayesian Methods)的湯姆森采樣(Thompson Sampling)來估計(jì)點(diǎn)擊率,替代了LinUCB的置信區(qū)間估計(jì)。這類算法的特點(diǎn)是隨機(jī)性更強(qiáng),參數(shù)估計(jì)更加穩(wěn)定化,并且應(yīng)用在LinkedIn的廣告推薦中達(dá)到了更好的效果,為LinkedIn的廣告系統(tǒng)提供了更加健康的環(huán)境。從雅虎新聞推薦到LinkedIn的首頁信息流推薦,在物品集合不太多的情況下(在幾百個物品這個范圍內(nèi)),“聯(lián)系上下文的多臂老虎機(jī)”技術(shù)已經(jīng)被證明對系統(tǒng)和用戶的長期交互流程優(yōu)化有顯著效果。此后,在這方面的研究工作如雨后春筍般出現(xiàn)。
然而,在更加復(fù)雜的線上大規(guī)模推薦系統(tǒng)實(shí)踐中,“聯(lián)系上下文的多臂老虎機(jī)”算法并沒有受到垂青,很多產(chǎn)品并不愿意接受這類算法。原因是,這類算法在理論中有很美的證明和數(shù)學(xué)性質(zhì),但在現(xiàn)實(shí)操作中往往有不可逾越的產(chǎn)品體驗(yàn)障礙。比如,大多數(shù)此類算法因?yàn)樵谧铋_始的一段時間里并不熟悉和了解用戶,于是算法會傾向于多Exploration一些物品從而達(dá)到了解用戶的目的。
因此,這段時期里,用戶可能會面對不少沒那么相關(guān)的物品。在學(xué)術(shù)論文的假設(shè)中,只要度過了這段時間,算法就能夠比較好地學(xué)習(xí)到用戶的偏好,提供更加“靠譜”的推薦結(jié)果。然而,這種假設(shè)場景在現(xiàn)實(shí)中是不成立的。新用戶或者是黏性不高的用戶,往往使用產(chǎn)品的頻度并不高。這些用戶在少有的幾次使用中發(fā)現(xiàn)一些不那么相關(guān)的推薦結(jié)果后,很有可能會永久地放棄產(chǎn)品。而另一方面,高度黏性的用戶才可能有容忍度看一些不那么相關(guān)的推薦結(jié)果。所以,從這個例子看來,現(xiàn)有的理論和算法與實(shí)際應(yīng)用還有不小的距離,而“聯(lián)系上下文的多臂老虎機(jī)”算法所帶來的模型更新還遠(yuǎn)沒有給推薦系統(tǒng)帶來真正的“智能”。
與強(qiáng)化學(xué)習(xí)類似的另一種思路則是從控制論或系統(tǒng)論的角度來看待推薦系統(tǒng),為用戶和系統(tǒng)的回饋閉合系統(tǒng)建模。University College London的Tamas Jambor等人于2012年的WWW會議上發(fā)表論文,率先闡述了如何設(shè)計(jì)PID控制器(原始思路來自控制論)來穩(wěn)定推薦系統(tǒng)的運(yùn)行使其能夠保持推薦高質(zhì)量內(nèi)容。
在此基礎(chǔ)上,Weinan Zhang等人在2016年的WSDM會議上把類似的思路擴(kuò)展到了廣告系統(tǒng)的實(shí)時競價上,展示了相關(guān)算法的穩(wěn)定性和優(yōu)化性。盡管把控制論引入推薦系統(tǒng)研究是對把推薦系統(tǒng)看做是用戶系統(tǒng)整體系統(tǒng)優(yōu)化這一思想的進(jìn)一步推動,且具有開創(chuàng)精神和建設(shè)性意義,然而這個思路在現(xiàn)代工業(yè)級推薦系統(tǒng)中還鮮有應(yīng)用。不過,強(qiáng)化學(xué)習(xí)與控制論之間的內(nèi)在邏輯聯(lián)系,很可能會為下一個階段這一方面的研究提供新的思路。
所以,不管是強(qiáng)化學(xué)習(xí)還是控制論,從大背景來看,雖然利用人工智能技術(shù)改善推薦系統(tǒng)的研發(fā)和探索方興未艾,但目前的主流算法和模型還遠(yuǎn)沒有讓推薦系統(tǒng)達(dá)到“自動駕駛汽車”或者“無人機(jī)”的“智能”程度。
人工智能時代的前哨站
從2006年開始的深度學(xué)習(xí)(Deep Learning)浪潮對整個人工智能領(lǐng)域產(chǎn)生了顛覆性影響,不少學(xué)者和公司也開始嘗試采用深度學(xué)習(xí)模型解決傳統(tǒng)模型很難甚至無法解決的問題。
第一類探索包括利用深度學(xué)習(xí)模型替代傳統(tǒng)模型在已知問題上提高推薦效果,如看能否利用深度學(xué)習(xí)的模型替代矩陣分解。比較新的代表工作有香港科技大學(xué)的Hao Wang等人(論文發(fā)表在KDD 2015)以及Simon Fraser University的Yao Wu等人(論文發(fā)表在WSDM 2016),都嘗試擴(kuò)展Stacked Denoising Auto-encoder來提高評分預(yù)測的精準(zhǔn)度。
更加簡單的思路,則是利用深度學(xué)習(xí)技術(shù)來提取高層次(High Level)特征(Feature),然后和傳統(tǒng)模型融合以提高推薦系統(tǒng)的整體性能。
這一思路可以在短時期內(nèi)不改變現(xiàn)有的推薦框架,又可以最大限度地利用深度學(xué)習(xí)技術(shù)現(xiàn)有的優(yōu)勢,所以很受工業(yè)界的青睞。
比如很多公司(公開的有Google、LinkedIn、雅虎等)都開始利用神經(jīng)語言模型(Neural Language Model)來提取文字特性,從而能夠更好地表達(dá)文字信息。
再比如音頻和視頻推薦問題,因?yàn)榻谏疃葘W(xué)習(xí)在這些媒體上的成功應(yīng)用,推薦比以前變得相對容易。典型應(yīng)用就是YouTube采用深度學(xué)習(xí)來提取視頻特征,有效地推薦用戶喜愛的視頻。總體說來,這類探索容易實(shí)現(xiàn),可以視為機(jī)器學(xué)習(xí)時代的自然擴(kuò)展。
第二類嘗試主要是利用深度學(xué)習(xí)技術(shù)探索以前不容易解決的一些問題。如著名的音樂播放平臺Spotify利用遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network)來預(yù)測下一首推薦的歌曲,取得了不錯的在線效果。遞歸神經(jīng)網(wǎng)絡(luò)的特點(diǎn)是能夠把長距離的依賴關(guān)系給很自然地表達(dá)在模型中, 而傳統(tǒng)基于矩陣分解的方法則比較難以抓住這樣的特征。
與此類似的場景是西班牙Telefonica Research學(xué)者在ICLR 2016發(fā)表的論文,應(yīng)用遞歸神經(jīng)網(wǎng)絡(luò)來對整個用戶會話(Session)進(jìn)行建模,從預(yù)測用戶對單個物品的喜愛到預(yù)測用戶在整個會話中的行為。所用方法在Netflix數(shù)據(jù)集上,推薦精度明顯好過傳統(tǒng)方法。另外,Google DeepMind組最近也開始把深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning)的思想擴(kuò)展到推薦系統(tǒng)領(lǐng)域。
前文提到傳統(tǒng)的“聯(lián)系上下文的多臂老虎機(jī)”算法目前最好的應(yīng)用場景還在于幾百到幾千這個數(shù)量級的物品池(Item Pool),對于大量的物品池還沒有很好的解決方案。DeepMind最新發(fā)表的一篇技術(shù)報(bào)告嘗試對非常大的離散選擇空間(Discrete Action Spaces)問題提出解決方案,成為解決這類問題的一個有意義的嘗試。
隨著AlphaGo的成功,深度強(qiáng)化學(xué)習(xí)成為當(dāng)下非?;馃岬难芯糠较?。然而這個方向的算法離真正的生產(chǎn)應(yīng)用還有不小的距離,主要的障礙在于強(qiáng)化學(xué)習(xí)在推薦系統(tǒng)中的一般應(yīng)用還并沒有完全普及,有產(chǎn)品和技術(shù)方面的鴻溝需要解決。
總體來說,深度學(xué)習(xí)在推薦系統(tǒng)領(lǐng)域的應(yīng)用依然在初級階段。不管是算法還是解決問題的思路,均沒有從根本上改變機(jī)器學(xué)習(xí)時代和準(zhǔn)人工智能時代的推薦系統(tǒng)研發(fā)。
真正的人工智能不僅需要更加靈活強(qiáng)大的模型,也需要科研人員對推薦系統(tǒng)的問題范疇有更進(jìn)一步的思考,從更加準(zhǔn)確預(yù)測用戶的喜好,提升到如何優(yōu)化用戶、系統(tǒng)、市場(Market Place)的整體健康。
比如,很多互聯(lián)網(wǎng)應(yīng)用,都在內(nèi)容推薦的頁面上插入很多廣告內(nèi)容。傳統(tǒng)上這些子系統(tǒng)都是分開設(shè)計(jì)和實(shí)現(xiàn)的,它們之間的依賴關(guān)系很模糊,最后的用戶體驗(yàn)也不穩(wěn)定。如何在廣告利潤和整體用戶體驗(yàn)之間平衡是很多推薦系統(tǒng)需要考慮的問題。
另外,用戶在一個應(yīng)用中的整體體驗(yàn)是由一系列的行為組成的,在此之上,用戶還有更高層次的需求。比如在一個電子商務(wù)網(wǎng)站上,用戶除了希望快捷地買到合適的東西,可能還希望了解到時尚的信息,以及與有類似興趣的朋友交流。優(yōu)化單一目標(biāo)的推薦系統(tǒng)是無法滿足如此復(fù)雜的需求的。如何挖掘出用戶的潛在需求,如何整體優(yōu)化這些目標(biāo),是推薦系統(tǒng)邁向智能系統(tǒng)的一個重要步驟。
結(jié)語
人工智能技術(shù)對于推薦系統(tǒng)的影響是巨大的。從人工推薦到深度學(xué)習(xí)模型,在日新月異的技術(shù)浪潮中,推薦系統(tǒng)已經(jīng)成為了諸多互聯(lián)網(wǎng)應(yīng)用的基石。過去十多年的研究和開發(fā),使得這個領(lǐng)域迅猛發(fā)展,推動了人工智能很多方向的前進(jìn)。從現(xiàn)實(shí)來看,推薦系統(tǒng)要成為智能系統(tǒng),還有很長的路要走。我們需要站在更高的維度來看待和思考推薦系統(tǒng),提出更加具有挑戰(zhàn)的問題,基于這些問題才能引領(lǐng)我們?nèi)ジ镄路椒ㄕ?,?chuàng)新出一整套能夠大幅度豐富用戶體驗(yàn)與提高產(chǎn)品價值的推薦系統(tǒng)理論與實(shí)踐。
來源:網(wǎng)絡(luò)大數(shù)據(jù)
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費(fèi)金融國際峰會62018-06-21
- 第五屆FEA消費(fèi)金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
10#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新