遇見伯樂:大數(shù)據(jù)時代的人才推薦系統(tǒng)
洪文興 王寧 | 2017-07-03 14:15
【數(shù)據(jù)猿導(dǎo)讀】 拉勾網(wǎng)定位于專業(yè)的互聯(lián)網(wǎng)招聘平臺,專注互聯(lián)網(wǎng)職位機(jī)會,充分利用行業(yè)領(lǐng)域特點(diǎn)和知識。此外還有內(nèi)推網(wǎng)等配合人工運(yùn)作的信息網(wǎng)站。

1 人才推薦系統(tǒng)的應(yīng)用背景
隨著Web2.0技術(shù)的發(fā)展,越來越多的求職者在互聯(lián)網(wǎng)上尋找就業(yè)機(jī)會,企業(yè)選擇在招聘網(wǎng)站發(fā)布職位網(wǎng)羅人才。目前流行的招聘網(wǎng)站按照其應(yīng)用的技術(shù)大致可以劃分為5類(如圖1所示):傳統(tǒng)信息門戶類、職業(yè)社交類、推薦類、垂直行業(yè)類以及人工輔助類。傳統(tǒng)信息門戶類又可以劃分為專業(yè)型門戶和綜合型門戶,該類網(wǎng)站以靜態(tài)信息展示、發(fā)布為主,典型的代表是51JOB和58同城,前者專注于全行業(yè)全國各地的求職招聘,而后者則作為一個綜合的生活分類信息網(wǎng)站,以兼職和短期工作招聘為主。傳統(tǒng)信息門戶類招聘網(wǎng)站由于缺乏個性化服務(wù),面臨著技術(shù)轉(zhuǎn)型難題。LinkedIn則是職業(yè)社交類招聘網(wǎng)站的典型代表,它為每一個用戶構(gòu)建專屬的職業(yè)人脈,然后利用這些人脈接觸有意向的崗位或者求職候選人。Monster是一個以推薦技術(shù)為核心的求職招聘網(wǎng)站,通過為每一個求職者和企業(yè)招聘人員提供個性化推薦,實(shí)現(xiàn)信息對接。與前三者不同,拉勾網(wǎng)定位于專業(yè)的互聯(lián)網(wǎng)招聘平臺,專注互聯(lián)網(wǎng)職位機(jī)會,充分利用行業(yè)領(lǐng)域特點(diǎn)和知識。此外還有內(nèi)推網(wǎng)等配合人工運(yùn)作的信息網(wǎng)站。在上述各類網(wǎng)站中,推薦功能是眾人關(guān)注的熱點(diǎn)[1,2]。
圖1 求職招聘網(wǎng)站分類
2 大數(shù)據(jù)時代的人才招聘問題
各類求職招聘網(wǎng)站的普遍應(yīng)用為人才招聘的研究提供了數(shù)據(jù)基礎(chǔ)。與此同時,在大數(shù)據(jù)環(huán)境下,新一代人才推薦系統(tǒng)對服務(wù)個性化、精準(zhǔn)化要求越來越強(qiáng)烈,其研究面臨著新的機(jī)遇和挑戰(zhàn)[3]。
從求職者(job seeker)的角度看,更加智能化、個性化的簡歷系統(tǒng)可以引導(dǎo)他們更快速、更準(zhǔn)確地完成一份充分表現(xiàn)自身優(yōu)勢的簡歷。更重要的是,求職者希望應(yīng)用系統(tǒng)可以根據(jù)求職者自身個性化的特點(diǎn)與偏好,從冗長的職位列表中更加精準(zhǔn)地鎖定、推薦感興趣的職位。此外,系統(tǒng)應(yīng)提供更簡便的人性化服務(wù)。
從企業(yè)人力資源(HR)經(jīng)理的角度出發(fā),希望應(yīng)用系統(tǒng)能夠從海量的簡歷中快速篩選出最合適的候選人集合,并提供求職者盡可能詳細(xì)的信息,以便全方位地了解求職者。與此同時,利用招聘網(wǎng)站的人才評價體系,可以更好地對接企業(yè)內(nèi)部人力資源管理系統(tǒng)[4],為企業(yè)制定切合單位發(fā)展需求的人才儲備、培養(yǎng)以及考核等相關(guān)制度提供決策參考。
對于應(yīng)用系統(tǒng)的經(jīng)營者而言,有效地協(xié)助用戶完成對接,提高系統(tǒng)求職與招聘對接的成功率,加強(qiáng)系統(tǒng)人性化服務(wù)、增強(qiáng)用戶體驗(yàn)感,吸引各類用戶、聚合用戶是其基本訴求。此外,發(fā)布人才年度統(tǒng)計(jì)報告、人才預(yù)測報告等,從行業(yè)、地域、時間等維度進(jìn)行勞動力市場供求關(guān)系分析,為企業(yè)、政府經(jīng)濟(jì)規(guī)劃提供參考,為系統(tǒng)運(yùn)營贏得聲譽(yù),產(chǎn)生更多的社會經(jīng)濟(jì)效益。
經(jīng)過多年的行業(yè)觀察和實(shí)踐分析,筆者發(fā)現(xiàn)大數(shù)據(jù)時代的人才推薦系統(tǒng)需要解決如下關(guān)鍵問題:
●不同行業(yè)領(lǐng)域下個性化簡歷模板和職位模板的構(gòu)建方法;
●基于用戶簡歷、系統(tǒng)內(nèi)操作行為、用戶間交互等多維異構(gòu)數(shù)據(jù)的用戶特征提取與用戶建模方法;
●基于求職用戶職位偏好與企業(yè)用戶招聘偏好相互匹配的雙向推薦算法;
●個性化、人性化的信息收集策略,數(shù)據(jù)統(tǒng)計(jì)、發(fā)布的多元數(shù)據(jù)可視化展示問題。
3 智能人才推薦系統(tǒng)實(shí)例:iHR+
3.1iHR+
自2010年以來,廈門大學(xué)與廈門人才網(wǎng)聯(lián)合開展人才推薦研究。廈門人才網(wǎng)服務(wù)廈門本地及其周邊城市的7萬家企業(yè),每天在線有效職位儲量超過23萬個,人才庫擁有170多萬份人才簡歷,日均訪問量達(dá)70萬頁面瀏覽量(pageview,PV)。在廈門人才網(wǎng)多年數(shù)據(jù)積累的基礎(chǔ)上,研究分為3期完成[5,6],具體內(nèi)容如圖2所示。
圖2 廈門人才網(wǎng)人才推薦項(xiàng)目
項(xiàng)目通過對用戶求職意向的分析,結(jié)合個性化表單收集結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)人才簡歷自動創(chuàng)建的電子簡歷系統(tǒng)。結(jié)合用戶的系統(tǒng)操作行為等特征完成用戶建模。在此基礎(chǔ)上,對企業(yè)職位需求進(jìn)行分析,設(shè)計(jì)推薦指數(shù)、推薦熱度[7]等指標(biāo),采用信息融合模型初步實(shí)現(xiàn)雙向混合推薦算法[8]。此外,對用戶搜索各類信息需求的分析、整合,實(shí)現(xiàn)了智能搜索以及地圖搜索、信息訂閱與推送、界面自適應(yīng)(iHRHD)與美化等人性化服務(wù),方便用戶使用。
在理解用戶需求的基礎(chǔ)上,筆者提出若干關(guān)鍵問題,進(jìn)行算法研究、論證評估與改進(jìn),形成了針對人才推薦的智慧解決方案——iHR+。圖3為方案的整體架構(gòu)。
圖3 iHR+總體架構(gòu)
3.2iHR+人才推薦系統(tǒng)關(guān)鍵問題的解決
在人才推薦系統(tǒng)中,求職者與職位提供方之間的關(guān)系是一種二元關(guān)系,即只存在二者之間的交互,而不存在求職者之間或者職位提供方之間的交互。這種強(qiáng)二元關(guān)系也是互惠推薦的一大特性。為此,采用二部圖的方式建立人才推薦模型,如圖4所示。
圖4 二部圖人才推薦模型
(1)基于多維特征空間的用戶建模方法用戶特征是推薦系統(tǒng)的數(shù)據(jù)基礎(chǔ),傳遞著求職用戶的信息和興趣偏好[9]。
筆者根據(jù)用戶的特征來源,將用戶特征分為用戶自然人信息的基本特征、個性化簡歷中提取的提取特征、用戶在系統(tǒng)中各類操作的操作特征以及用戶間互動的標(biāo)簽特征四大類。依據(jù)每項(xiàng)特征的特點(diǎn)進(jìn)行特征表示與存儲,創(chuàng)建了多維用戶特征空間。
(2)面向求職招聘領(lǐng)域的雙向推薦模式
2010年P(guān)izzatoL等人[10]首次提出雙向推薦,雙向推薦是個性化推薦系統(tǒng)中的一個獨(dú)特的分支,該推薦算法適用于推薦雙方用戶之間有偏好的系統(tǒng),如在線約會系統(tǒng)[11]、人才推薦系統(tǒng)等,它考慮了推薦雙方用戶之間的相互偏好關(guān)系,使用戶雙方達(dá)到雙贏的效果,也提高了推薦系統(tǒng)的準(zhǔn)確性。在人才推薦系統(tǒng)中,MalinowskiJ等人[12]根據(jù)雙方用戶的偏好信息分別構(gòu)建面向個人用戶和企業(yè)用戶的推薦系統(tǒng),綜合考慮雙方的推薦結(jié)果。YuH等人[13]提出一種融合了雙方用戶的顯性與隱性偏好信息的相似度計(jì)算方法,進(jìn)一步探討雙方用戶偏好程度之間彼此的關(guān)聯(lián)度對于推薦結(jié)果的影響,即人才推薦中的雙向推薦問題。
(3)基于上下文信息的推薦模式
除了求職者與企業(yè)單位雙方的特征信息,潛在的上下文信息也是推薦系統(tǒng)可以考慮的重要信息來源。例如,分析某求職者的工作經(jīng)歷,如果發(fā)現(xiàn)其頻繁地更換工作且每份工作的時間不長,可推測他缺乏自身定位、能力評價或職位所需品質(zhì)等可能性,這就是潛在的上下文信息。因此,在系統(tǒng)推薦中,需以恰當(dāng)?shù)男问竭M(jìn)行判定,并調(diào)整向企業(yè)單位推薦該求職者的推薦度。
(4)基于領(lǐng)域?qū)<抑R的推薦模式
在人才推薦領(lǐng)域中,常見的專家知識有專業(yè)的分類、職位部門的分類以及技能的分類等。專家知識具有很高的可信度與參考價值,構(gòu)建一個完整的專家知識體系有利于為企業(yè)單位推薦相關(guān)專業(yè)的人才,或者為求職者推薦相關(guān)職位甚至更高一級的職位等[14,15]。例如,某求職者熟練掌握C++,通過專家知識體系中計(jì)算機(jī)方面技能分類的分析[16],可知Java、C等語言與C++的相關(guān)性很高,則可以向該求職者推薦Java、C方面的職位。
(5)基于動態(tài)時間效應(yīng)的推薦模式
人才市場職位的招聘具有時效性。招聘職位在一定的時間段內(nèi)有效,超過該時間段后則失效,因此在職位推薦中應(yīng)考慮職位的有效期,防止將已失效的職位推薦給求職者,同理,對于求職者也應(yīng)考慮活躍性[17],將注冊并使用推薦系統(tǒng)已順利找到當(dāng)前滿意的工作,從此不再登錄推薦系統(tǒng)的不活躍求職者推薦給企業(yè)單位是沒有實(shí)際意義的。綜上,職位的時間有效性、求職者的時間動態(tài)性(活躍度)都是推薦系統(tǒng)應(yīng)該考慮的因素,都會影響推薦結(jié)果的質(zhì)量和用戶滿意度。
3.3人才推薦研究應(yīng)用的成功拓展
基于在人才推薦領(lǐng)域的工作成果,筆者拓展了問題研究領(lǐng)域,針對專家型人才不主動提供信息且隱性信息明顯的特點(diǎn),設(shè)計(jì)并實(shí)現(xiàn)了專家信息搜尋、專家推薦等功能平臺,取名“科技驛棧”。起始頁如圖5所示。
圖5 大規(guī)模專家協(xié)作創(chuàng)新平臺(科技驛棧)
“科技驛棧”是一個面向中小企業(yè)科技創(chuàng)新的服務(wù)平臺,旨在為廣大產(chǎn)業(yè)技術(shù)工作者提供一站式創(chuàng)新服務(wù),為產(chǎn)業(yè)研發(fā)人員之間、科研院所研究人員之間、產(chǎn)—學(xué)—研之間的大規(guī)模協(xié)作提供協(xié)同創(chuàng)新平臺。它收集分布在全國各高校、科研機(jī)構(gòu)的各領(lǐng)域?qū)<屹Y料信息,包括專家論文、專利、活動、企業(yè)新聞等文獻(xiàn)以及專家活動、項(xiàng)目、成果等,通過建立搜索引擎,開展數(shù)據(jù)挖掘、系統(tǒng)推薦,提供領(lǐng)域?qū)<壹跋嚓P(guān)信息的智能搜索與在線推薦,方便企業(yè)尋找所需領(lǐng)域的專家。
來源:大數(shù)據(jù)期刊
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費(fèi)金融國際峰會62018-06-21
- 第五屆FEA消費(fèi)金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
10#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新