幾組模型教你看清零售業(yè)的數(shù)據(jù)挖掘問(wèn)題
【數(shù)據(jù)猿導(dǎo)讀】 零售是數(shù)據(jù)科學(xué)和數(shù)據(jù)挖掘重要的商業(yè)應(yīng)用領(lǐng)域之一。零售領(lǐng)域有著豐富的數(shù)據(jù)和大量的優(yōu)化問(wèn)題,如優(yōu)化價(jià)格、折扣、推薦、以及庫(kù)存水平等可以用數(shù)據(jù)分析優(yōu)化的問(wèn)題

來(lái)源:數(shù)據(jù)猿 編譯:張夏天
本文介紹了零售業(yè)中的數(shù)據(jù)挖掘問(wèn)題,零售是數(shù)據(jù)科學(xué)和數(shù)據(jù)挖掘重要的商業(yè)應(yīng)用領(lǐng)域之一。零售領(lǐng)域有著豐富的數(shù)據(jù)和大量的優(yōu)化問(wèn)題,如優(yōu)化價(jià)格、折扣、推薦、以及庫(kù)存水平等可以用數(shù)據(jù)分析優(yōu)化的問(wèn)題。
正文:
全渠道零售,即在所有線上和線下渠道整合營(yíng)銷、客戶關(guān)系管理庫(kù)存管理的崛起產(chǎn)生了大量的關(guān)聯(lián)數(shù)據(jù),大大增強(qiáng)了數(shù)據(jù)驅(qū)動(dòng)型決策的重要性和能力。
盡管已經(jīng)有許多關(guān)于數(shù)據(jù)挖掘在營(yíng)銷和客戶關(guān)系管理方面的書,如 [BE11, AS14, PR13 etc.],但絕大多數(shù)書的結(jié)構(gòu)更像是數(shù)據(jù)科學(xué)家手冊(cè),專注在算法和方法論,并且假設(shè)人的決策是處于將分析結(jié)果到業(yè)務(wù)執(zhí)行上的中心位置。
在這篇文章中我們?cè)噲D采用更加嚴(yán)謹(jǐn)?shù)姆椒ê拖到y(tǒng)化的視角來(lái)探討基于數(shù)據(jù)分析的經(jīng)濟(jì)學(xué)模型和目標(biāo)函數(shù)如何使得決策更加自動(dòng)化。在這篇文章里, 我們將描述一個(gè)假想的收入管理平臺(tái),這一平臺(tái)基于零售商的數(shù)據(jù)并控制零售策略的很多方面,如價(jià)格、營(yíng)銷和倉(cāng)儲(chǔ)。
我們專注在將經(jīng)濟(jì)學(xué)框架和數(shù)據(jù)挖掘方法的組合有以下兩個(gè)主要的原因:
-
我們可以從經(jīng)濟(jì)學(xué)教科書上找到上百個(gè)與零售有關(guān)的經(jīng)濟(jì)學(xué)模型,因?yàn)殛P(guān)于市場(chǎng)、折扣、競(jìng)爭(zhēng)等問(wèn)題在上個(gè)世紀(jì)得到了深入的研究。然而,許多模型都是高度參數(shù)化的(即嚴(yán)格的由帶有有限參數(shù)的公式所定義)并且不能足夠靈活而精確地對(duì)現(xiàn)實(shí)世界的問(wèn)題建模。
但數(shù)據(jù)挖掘提供了很多非參數(shù)建模技術(shù),可以幫助創(chuàng)建靈活而實(shí)用的模型。在最近十年里,也有許多成功的平衡抽象模型和機(jī)器學(xué)習(xí)技術(shù)的文章和案例研究已經(jīng)發(fā)表。
-
快速的數(shù)據(jù)循環(huán)使得在現(xiàn)代零售業(yè)中可以使用相對(duì)簡(jiǎn)單的模型做出更加準(zhǔn)確的預(yù)測(cè),因?yàn)樾∫?guī)模增量式的預(yù)測(cè)一般而言要比大決策更加容易。
例如,因?yàn)閷?duì)于一個(gè)新的顛覆性產(chǎn)品在消費(fèi)者心中的感知價(jià)值是未知的,要計(jì)算它的最優(yōu)價(jià)格是很困難的。但是根據(jù)需求和庫(kù)存水平實(shí)時(shí)調(diào)整促銷價(jià)格則是相對(duì)容易的。有一些成功的商業(yè)解決方案對(duì)價(jià)格優(yōu)化就幾乎丟棄了經(jīng)濟(jì)學(xué)模型,簡(jiǎn)單的根據(jù)銷售閉環(huán)的反饋情況來(lái)決定價(jià)格的上升和下降 [JL11]。
以上兩點(diǎn)意味著在零售業(yè)自動(dòng)化決策和動(dòng)態(tài)優(yōu)化具有很高的潛力,因此我們專注于研究這個(gè)領(lǐng)域。本文很大篇幅用于綜述零售業(yè)者和研究人員發(fā)表的成果,這些成果都是他們?cè)诰C合應(yīng)用抽象經(jīng)濟(jì)學(xué)模型和數(shù)據(jù)挖掘方法構(gòu)建實(shí)際的決策和優(yōu)化系統(tǒng)中產(chǎn)生的。
特別的,本文主要受到 3 個(gè)案例研究的啟發(fā),分別出自 Albert Heijn [KOK07], 新西蘭最大的連鎖超市,Zara [CA12], 一家國(guó)際服裝零售商,以及 RueLaLa [JH14], 一家創(chuàng)新在線時(shí)尚零售商。我們同樣綜合了來(lái)自 Amazon、Netflix、LinkedIn 和許多獨(dú)立研究者和商業(yè)項(xiàng)目的結(jié)果。同時(shí),我們避免使用那些缺乏實(shí)踐支持的學(xué)術(shù)結(jié)果。
我們的研究主要著眼于與收入管理相關(guān)的優(yōu)化問(wèn)題,包括營(yíng)銷和定價(jià)等問(wèn)題。更加特殊的數(shù)據(jù)挖掘應(yīng)用,如供應(yīng)鏈優(yōu)化和欺詐檢測(cè), 數(shù)據(jù)挖掘過(guò)程實(shí)現(xiàn)的細(xì)節(jié)(如模型質(zhì)量的驗(yàn)證)則不在這我們研究的范疇內(nèi)。
本文剩余部分組織如下:
-
我們首先引入一個(gè)簡(jiǎn)單的框架將零售商的行為,利潤(rùn)和數(shù)據(jù)聯(lián)系在一起。此框架將作為更統(tǒng)一的方式來(lái)描述分析問(wèn)題。
-
本文的主體部分探討了一系列與零售業(yè)相關(guān)的優(yōu)化問(wèn)題。我們將在不同章節(jié)逐個(gè)介紹這些問(wèn)題。每個(gè)章節(jié)會(huì)簡(jiǎn)要描述問(wèn)題,并提供一組業(yè)務(wù)案例和應(yīng)用,以及詳細(xì)介紹如何將問(wèn)題分解成經(jīng)濟(jì)學(xué)模型和數(shù)據(jù)挖掘任務(wù),使得可以通過(guò)數(shù)值優(yōu)化方法來(lái)解決業(yè)務(wù)問(wèn)題。
-
然后,我們會(huì)有一個(gè)章節(jié)專門討論這些方法在實(shí)際應(yīng)用中的可期的經(jīng)濟(jì)收益。
-
最后,總結(jié)部分會(huì)對(duì)這些問(wèn)題之間的依賴關(guān)系進(jìn)行討論,從而闡明一般的原則和關(guān)鍵點(diǎn)。
優(yōu)化框架
本文介紹了 6 個(gè)主要與營(yíng)銷和定價(jià)相關(guān)的優(yōu)化問(wèn)題,這些問(wèn)題都能夠應(yīng)用數(shù)據(jù)挖掘技術(shù)來(lái)解決。盡管這些問(wèn)題非常不同,但我們嘗試建立了一般性的框架來(lái)幫助設(shè)計(jì)求解所需的優(yōu)化和數(shù)據(jù)挖掘任務(wù)。
該框架的基本思想是用一個(gè)經(jīng)濟(jì)指標(biāo),例如毛利率作為優(yōu)化目標(biāo),并將這一目標(biāo)作為零售商行為(如營(yíng)銷活動(dòng)或者分類調(diào)整)的函數(shù)。
同時(shí)計(jì)量經(jīng)濟(jì)學(xué)目標(biāo)也是數(shù)據(jù)的一個(gè)函數(shù),即計(jì)量經(jīng)濟(jì)模型應(yīng)該被零售商的特性參數(shù)化,從而在其輸出中產(chǎn)生一個(gè)數(shù)值,如毛利率。
例如,某零售商在計(jì)劃一個(gè)郵件營(yíng)銷活動(dòng)。可行的行動(dòng)空間可被定義為一組對(duì)于每個(gè)客戶發(fā)送/不發(fā)送決策集合,而活動(dòng)的毛利率則決定于營(yíng)銷動(dòng)作(有些人會(huì)接受激勵(lì)而另一些人不會(huì))以及給定客戶的期望收入和郵件成本。這一方法可以更形式化的由如下公式表達(dá):
此公式里 G 是可用于分析的數(shù)據(jù),是零售業(yè)者行為和決策空間, 是計(jì)量經(jīng)濟(jì)模型函數(shù),其參數(shù)是 d 和 A,而 A0 是最優(yōu)策略。這一框架由文獻(xiàn) [JK98] 整理提出。
模型 G 的設(shè)計(jì)十分依賴于問(wèn)題本身。在大部分情況下,對(duì)毛利率建模和優(yōu)化都是合理的。但是,有些情況下其他的目標(biāo)也是有可能的,就如下一章探討的響應(yīng)建模。同時(shí)需要注意的是優(yōu)化問(wèn)題(1)也跟時(shí)間有關(guān)系,因?yàn)榄h(huán)境會(huì)隨著如新產(chǎn)品的上架、競(jìng)爭(zhēng)對(duì)手的行動(dòng)等因素變化,零售業(yè)者自己的行為也會(huì)產(chǎn)生影響。
數(shù)據(jù)挖掘在這一優(yōu)化問(wèn)題中的角色是非常重要的,因?yàn)橛?jì)量模型 G 通常都比較復(fù)雜且必須基于數(shù)據(jù)通過(guò)回歸等數(shù)據(jù)挖掘技術(shù)學(xué)習(xí)確定。
在某些情況下因?yàn)閺?fù)雜性太高(如用戶的行為很難精確預(yù)測(cè))或者因?yàn)闊o(wú)法將現(xiàn)有數(shù)據(jù)做外推(如對(duì)于完全新的服務(wù)),模型是無(wú)法完全確定的。這時(shí),可以用 A/B 測(cè)試和問(wèn)卷調(diào)查來(lái)獲得額外的數(shù)據(jù)來(lái)改進(jìn)模型的精度。
問(wèn)題 1: 響應(yīng)建模
問(wèn)題描述
在廣告或者特價(jià)優(yōu)惠活動(dòng)中,需要決定將一些資源投放給一些客戶。而這些資源都是有成本的,如郵寄印制商品的目錄的資金成本,或者一些負(fù)面效應(yīng)(如使得用戶取消郵通知訂閱)。
同時(shí), 這些資源將會(huì)影響用戶的決策,如促使他們更多地消費(fèi)或者購(gòu)買更高價(jià)值的產(chǎn)品。其目標(biāo)是找到一組最靠譜的候選客戶,對(duì)他們投入資源后能夠使得業(yè)績(jī)最大化。
投入的資源可以是同質(zhì)的(如所有參加的客戶都得到同樣的激勵(lì))也可以是個(gè)性化的。在后一種情況下,零售業(yè)者將對(duì)每個(gè)不同的客戶提供不同的激勵(lì)如不同產(chǎn)品的優(yōu)惠券來(lái)最大化總體的收益目標(biāo)。
應(yīng)用
響應(yīng)建模被廣泛的應(yīng)用在營(yíng)銷和客戶關(guān)系管理上:
-
確定特定的折扣、優(yōu)惠券和特價(jià),需要識(shí)別出客戶對(duì)這些激勵(lì)的反應(yīng)。
-
有這對(duì)性的郵件促銷、活動(dòng)和贈(zèng)品(如 4S 店提供的免費(fèi)太陽(yáng)眼鏡)通常需要識(shí)別出最優(yōu)價(jià)值的客戶來(lái)降低營(yíng)銷費(fèi)用。
-
客戶挽留計(jì)劃需要識(shí)別出那些可能會(huì)離開(kāi)但可以通過(guò)激勵(lì)來(lái)改變主意的客戶。例如,電商可以向那些放棄購(gòu)物車或者離開(kāi)搜索會(huì)話的客戶發(fā)送特價(jià)優(yōu)惠。
-
在線目錄和搜索結(jié)果可以根據(jù)客戶對(duì)某些商品的的喜好來(lái)重新調(diào)整。
-
響應(yīng)建模幫助優(yōu)化了電郵促銷來(lái)避免不必要的垃圾郵件,這些垃圾郵件可能會(huì)讓客戶取消郵件訂閱。
求解
基于以上的討論,我們現(xiàn)在可以認(rèn)識(shí)到這個(gè)問(wèn)題就是資源分配的優(yōu)化問(wèn)題,而優(yōu)化問(wèn)題由一個(gè)目標(biāo)函數(shù)驅(qū)動(dòng)。一個(gè)最基本的方法是根據(jù)每個(gè)客戶的響應(yīng)概率和期望凈價(jià)值來(lái)對(duì)促銷活動(dòng)的整體利潤(rùn)建模。
這里 Pr(R│u;I) 是給定客戶 u 對(duì)激勵(lì) I 的響應(yīng)概率,g(u|R)) 是這個(gè)客戶響應(yīng)的激勵(lì)的凈價(jià)值,而 c 則是激勵(lì)的成本。公式中第一項(xiàng)是響應(yīng)從響應(yīng)用戶獲得的凈收益,而第二項(xiàng)則是對(duì)應(yīng)在沒(méi)有響應(yīng)的客戶上的期望損失。目標(biāo)是通過(guò)找到一組最有可能響應(yīng)活動(dòng)并能貢獻(xiàn)高利潤(rùn)的客戶子集來(lái)最大化 G。因?yàn)楣?(1.1) 可以約簡(jiǎn)如下:
這里 E{g|u;I} 表示對(duì)給定客戶在假定他會(huì)接受激勵(lì)的情況下的毛利率的數(shù)學(xué)期望,而客戶的選擇標(biāo)準(zhǔn)則要符合以下條件:
同時(shí),最優(yōu)的客戶子集 U 可以定義為最大化毛利率的子集:
我們也可以以隨機(jī)分配激勵(lì)為基準(zhǔn)的凈值最大化。為此,我們假設(shè)參與該次營(yíng)銷活動(dòng)的客戶數(shù)固定為 |U|。首先,我們將公式 (1.2) 展開(kāi),顯示的包括對(duì)于隨機(jī)選取的 |U| 個(gè)客戶的營(yíng)銷活動(dòng)的期望毛利率。
此處 E{g|I} 是所有客戶上的平均凈價(jià)值。這一平均凈價(jià)值是常數(shù),因此在 |U| 確定的情況下在目標(biāo)函數(shù)中可以被略去。因此,公式(1.2)在固定 的情況下同樣可以得到(1.3):
然而,文獻(xiàn) [VL02] 提出這一模型存在一定的缺陷,因?yàn)樵撃P推蛴谝子诮邮芗?lì)的客戶,而沒(méi)有考慮那些有沒(méi)有激烈都會(huì)貢獻(xiàn)同樣利潤(rùn)的的客戶。為解決這一 缺陷,我們需要根據(jù)以下四種情況來(lái)計(jì)算客戶集合 U 的毛利率:
-
G1 – select U according to the equation (1.2) and send incentives to everyone in
-
G2 – select U randomly and send incentives to everyone in
-
G3 – select U according to the equation (1.2) but do not send incentives at all
-
G4 – select U randomly but do not send incentives at all
-
G1 - 根據(jù)公式(1.2)選擇 U 并向中所有客戶發(fā)送激勵(lì)
-
G2 - 隨機(jī)選擇 U 并向 U 中所有客戶發(fā)送激勵(lì)
-
G3 - 根據(jù)公式(1.2)選擇 U 但是不發(fā)送任何激勵(lì)
-
G4 - 隨機(jī)選擇 U 但是不發(fā)送任何激勵(lì)
公式(1.2)是最大化 之差即相較于隨機(jī)投放的提升度。另一種方法是優(yōu)化,這一目標(biāo)函數(shù)不僅僅度量相較于隨機(jī)投放的提升度同時(shí)還考慮去除掉在同樣的客戶集合上不做任何激勵(lì)的提升度。在此情況下,公式(1.2)變?yōu)槿缦滦问剑?/p>
此處最后一項(xiàng)對(duì)應(yīng)的是未被激勵(lì)的客戶的期望凈價(jià)值。這一方法被稱為差分響應(yīng)分析或者提升度建模由文獻(xiàn) [BE09] 提出。
值得注意的是,公式(1.2)和(1.4)都不是通過(guò)最大化營(yíng)銷費(fèi)用來(lái)優(yōu)化的。考慮如下情況,每個(gè)響應(yīng)的用戶可以貢獻(xiàn) 100 美元的凈利潤(rùn),而激勵(lì)費(fèi)用為 1 美元。如果一個(gè)客戶組有 100 萬(wàn)客戶,其中有 0.5% 的潛在響應(yīng)者,則花費(fèi)最大的營(yíng)銷活動(dòng)是對(duì)每個(gè)客戶都做觸達(dá)則最終將損失 50 萬(wàn)美元(總的響應(yīng)者貢獻(xiàn)的 50 萬(wàn)美元凈價(jià)值減去活動(dòng)費(fèi)用 100 萬(wàn)美元)。
公式(1.4)對(duì)于各種類型的價(jià)格折扣特別重要(優(yōu)惠券、臨時(shí)價(jià)格折扣、特價(jià))。考慮如下問(wèn)題:“一個(gè)零售商應(yīng)該向每天都買蘋果的人提供蘋果優(yōu)惠券嗎?” 根據(jù)公式(1.2),回答是肯定的。因?yàn)檫@個(gè)人很有可能會(huì)使用優(yōu)惠券。
然而,更可能的是這個(gè)客戶用更低的價(jià)格購(gòu)買了同樣數(shù)量的蘋果,根本上這會(huì)降低零售商的利潤(rùn)。公式(1.4)考慮了默認(rèn)的客戶行為從而消除了這一問(wèn)題。我們?cè)谙乱还?jié)將繼續(xù)討論價(jià)格區(qū)分問(wèn)題因?yàn)檫@一是個(gè)復(fù)雜的問(wèn)題遠(yuǎn)超了公式(1.4)范疇。
公式(1.2)和(1.4)中凈收入的數(shù)學(xué)期望能夠基于過(guò)去客戶對(duì)激勵(lì)是否接受的歷史數(shù)據(jù)用分類或者回歸模型來(lái)確定。這一問(wèn)題可能是非常有挑戰(zhàn)性的,特別是當(dāng)需要評(píng)估的激勵(lì)與過(guò)往出現(xiàn)過(guò)的都存在某種程度上的差異。
在這種情況下,全規(guī)模的活動(dòng)上線之前需要在一個(gè)客戶測(cè)試組上進(jìn)行測(cè)試。另外,對(duì)于零售業(yè)者而言毛利率并非唯一的關(guān)鍵指標(biāo)。在公式(1.2)和(1.4)中使用的毛利率度量關(guān)心的是第一次付款后即時(shí)的匯報(bào),從客戶關(guān)系管理的角度看這是非常簡(jiǎn)單的視角。
零售業(yè)者還會(huì)關(guān)心其他不同的度量,度量上的多元性是如此巨大以至于有一門專門研究這個(gè)問(wèn)題的經(jīng)濟(jì)學(xué)分支 - 傾向性建模[SG09, LE13] - 這一學(xué)科發(fā)展了不同的模型來(lái)預(yù)測(cè)用戶未來(lái)的行為。最重要的傾向性模型包括:
-
生命價(jià)值預(yù)測(cè)。生命價(jià)值模型是估計(jì)一個(gè)客戶在其生命周期內(nèi)可以貢獻(xiàn)的收入或者利潤(rùn)總額。這一指標(biāo)對(duì)于那些目標(biāo)為獲取新客的營(yíng)銷活動(dòng)而言是很重要的。
-
錢包份額預(yù)測(cè)。錢包份額模型用來(lái)估計(jì)用戶對(duì)于某些類型商品,如雜貨或者服飾,在某一零售商及其在各競(jìng)爭(zhēng)對(duì)手那花錢的比例。這一度量能夠揭示哪些客戶具有貢獻(xiàn)高收入的潛力,因?yàn)檫@一模型能夠用在忠誠(chéng)計(jì)劃和提升使用的營(yíng)銷活動(dòng)中。
-
類型擴(kuò)展傾向。該模型估計(jì)首次購(gòu)買某一類型的商品后,從休閑產(chǎn)品轉(zhuǎn)換到奢侈品的可能性。這一模型能夠幫助設(shè)計(jì)目的是獲得使用擴(kuò)展的活動(dòng)。
-
流失傾向。這一模型估計(jì)客戶從給定零售商流失并轉(zhuǎn)換到競(jìng)爭(zhēng)對(duì)手的可能性。如果客戶具有較高的流失傾向則可以定向進(jìn)行挽留活動(dòng)。例如,一個(gè)零售商可以識(shí)別出那些放棄了在線購(gòu)物車或者退出了搜索會(huì)話但是提供一定折扣或者贈(zèng)品后會(huì)改變主意的客戶。
-
購(gòu)物習(xí)慣改變傾向。每個(gè)客戶的購(gòu)物習(xí)慣最終確定了其對(duì)一個(gè)零售商的價(jià)值,即客戶的購(gòu)買頻率、購(gòu)買什么產(chǎn)品、購(gòu)買什么類型的產(chǎn)品等等。這些習(xí)慣通常是穩(wěn)定的,一旦零售商改變一個(gè)客戶的分層,這個(gè)分層將會(huì)持續(xù)。
因此,零售業(yè)者通常對(duì)找到那些對(duì)改變習(xí)慣比較開(kāi)放的客戶感興趣, 如那些從一個(gè)城市遷移到另一個(gè)城市的人群, 從學(xué)校畢業(yè)的學(xué)生, 剛剛結(jié)婚的人群等等。一個(gè)典型的例子是預(yù)測(cè)客戶是否在懷孕早期 [DG12] 因?yàn)樾律恼Q生會(huì)顯著的改變客戶的購(gòu)物行為。
以上模型都能夠嵌入類似公式(1.4)的公式來(lái)代替毛利率目標(biāo)。我們?cè)诤竺娴男」?jié)中將針對(duì)討價(jià)格差異化的情況下對(duì)折扣的響應(yīng)傾向建模的情況仔細(xì)探討傾向性建模。關(guān)于傾向性建模的更多細(xì)節(jié)可以參考 [FX06] 和 [SG09] 兩本書。
這一框架也能夠擴(kuò)展到在多個(gè)可能的激勵(lì)方案中選擇最優(yōu)的方案。例如,一個(gè)零售商可以估計(jì)對(duì)于兩個(gè)激烈方案 A 和 B(例如巧克力冰激淋和香草冰激淋)的期望表現(xiàn)然后對(duì)于給定的用戶可以根據(jù)以下標(biāo)準(zhǔn)[WE07]來(lái)選擇最優(yōu)的選項(xiàng):
最后,值得注意的是響應(yīng)建模是與客戶分群緊密耦合的:
-
響應(yīng)建模能夠用來(lái)檢驗(yàn)通過(guò)聚類行程的客戶分群的可行性。一個(gè)分群應(yīng)該對(duì)特定的營(yíng)銷計(jì)劃有持續(xù)的響應(yīng)。
-
傾向性模型是基于客戶數(shù)據(jù)訓(xùn)練得到的回歸和分類模型??蛻舴秩嚎梢詤⒖紝?duì)于主要回歸量的分析結(jié)果。另一方面,從聚類結(jié)果中也可以發(fā)現(xiàn)合理的傾向性模型。
關(guān)于編譯作者:
張夏天,TalkingData首席數(shù)據(jù)科學(xué)家,北京郵電大學(xué)碩士畢業(yè)。長(zhǎng)期從事機(jī)器學(xué)習(xí),推薦系統(tǒng)等方面的研究和應(yīng)用工作,在多個(gè)國(guó)際會(huì)議和期刊發(fā)表論文十余篇。曾在IBM中國(guó)研究院,騰訊數(shù)據(jù)平臺(tái)部,華為諾亞方舟實(shí)驗(yàn)室任職,從事算法研究,廣告優(yōu)化和流失數(shù)據(jù)挖掘等工作。
2013年加入TalkingData, 負(fù)責(zé)公司機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施和能力的建設(shè),和對(duì)產(chǎn)品和項(xiàng)目的數(shù)據(jù)科學(xué)需求的支持。領(lǐng)導(dǎo)了大規(guī)模機(jī)器學(xué)習(xí)算法開(kāi)源項(xiàng)目Fregata,實(shí)現(xiàn)了Lookalike等大規(guī)模算法服務(wù)。支持地理位置數(shù)據(jù)挖掘和多個(gè)核心產(chǎn)品的數(shù)據(jù)科學(xué)功能,以及多個(gè)地產(chǎn),金融,零售行業(yè)的數(shù)據(jù)科學(xué)項(xiàng)目。目前專注在數(shù)據(jù)科學(xué)自動(dòng)化和推薦系統(tǒng)。
注:本文由TalkingData數(shù)據(jù)學(xué)堂及張夏天本人授權(quán)并投遞數(shù)據(jù)猿發(fā)布,由張夏天翻譯自 Highly Scalable Blog 的一篇文章,原文作者為 Ilya Katsov。
來(lái)源:TalkingData數(shù)據(jù)學(xué)堂
刷新相關(guān)文章
我要評(píng)論
活動(dòng)推薦more >
- 2018 上海國(guó)際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國(guó)際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國(guó)國(guó)際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)2018-06-21
- “無(wú)界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過(guò)的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車
-
4數(shù)據(jù)智能 無(wú)限未來(lái)—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
10#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新