董飛:預測性營銷原理和實踐——“中國大數據技術先鋒108將”高端人物訪談第1期
DT學院 | 2017-07-25 11:32
【數據猿導讀】 2017年,由DT學院、清華大數據產業(yè)聯(lián)合會、山西省大數據產業(yè)協(xié)會聯(lián)合舉辦的“中國大數據技術先鋒108將”高端人物訪談活動正式啟動,圍繞大數據技術的多個層面進行分享,旨在搭建大數據技術傳播分享的高端平臺,促進大數據技術的業(yè)內交流

導語:古有水泊梁山英雄108將叱咤江湖,今有“中國大數據技術先鋒108將”高端人物訪談攪動風云。2017年,由DT學院、清華大數據產業(yè)聯(lián)合會、山西省大數據產業(yè)協(xié)會聯(lián)合舉辦,面向大數據產業(yè)的技術精英、專家學者以及大數據產業(yè)鏈領域公司CTO的“中國大數據技術先鋒108將”高端人物訪談活動正式啟動,圍繞大數據技術的多個層面進行分享,旨在搭建大數據技術傳播分享的高端平臺,促進大數據技術的業(yè)內交流。
首期專訪人物——中國頂尖數據科學家 董飛
“中國大數據技術先鋒108將” 高端人物訪談首期嘉賓董飛
Datatist首席架構師&COO,畢業(yè)于南開大學,碩士杜克大學畢業(yè)。先后在創(chuàng)業(yè)公司酷迅、百度基礎架構組和Amazon云計算部門,LinkedIn擔任高級工程師,Coursera從事數據工程師,負責過垂直搜索,百度云計算平臺研發(fā)和廣告系統(tǒng)的架構。為多位企業(yè)客戶解決營銷難題,具備豐富實踐經驗。
訪談主題:大數據技術在預測性營銷上的實踐
訪談錄
DT學院:請您談談什么是預測營銷?
董 飛:說到預測營銷,不得不先提個性化的用戶畫像。我們針對每一類數據實體,進一步分解可落地的數據維度,刻畫他/她的每一個特征,在聚集起來形成人群畫像。比如下面就是兩種典型年輕消費人群。
預測營銷中的元素具體包括:
用戶固定特征:性別,年齡,地域,教育水平,生辰八字,職業(yè),星座
用戶興趣特征:興趣愛好,使用APP,網站,瀏覽/收藏/評論內容,品牌偏好,產品偏好
用戶社會特征:生活習慣,婚戀,社交/信息渠道偏好,宗教信仰,家庭成分
用戶消費特征:收入狀況,購買力水平,商品種類,購買渠道喜好,購買頻次
用戶動態(tài)特征:當下時間,需求,正在前往的地方,周邊的商戶,周圍人群,新聞事件
當我們采集和分析這些用戶畫像,可以實現精準的預測營銷。這是最直接和最有價值的應用,廣告主可以通過用戶標簽來發(fā)布廣告給所要觸達的用戶,這里面又可以通過上圖提到的搜索廣告,展示社交廣告,移動廣告等多渠道的營銷策略,營銷分析,營銷優(yōu)化以及后端CRM/供應鏈系統(tǒng)打通的一站式營銷優(yōu)化,全么提升ROI。
我們再說一說營銷時代的變遷,傳統(tǒng)的企業(yè)大多還停留在“營銷1.0”時代,消費者需要什么,企業(yè)提供什么,而進入“營銷2.0”,以社會價值與品牌為使命,也不能完全精準對接個性化需求。進入營銷3.0的數據時代,我們要對每個消費者進行個性化匹配,一對一營銷,甚至精確算清楚成交轉化率,提高投資回報比。
營銷4P理論
大數據下的營銷顛覆經典的營銷4P理論,Product,Price,Place,Promotion,取而代之的是新的4P,People,Performance,Process,Prediction。在大數據時代,線下地理的競爭邊界早就不存在,比的是早一步的先知能力,利用大數據,從顧客真實交易數據中,計算下一次的購買時間。 營銷3.0時代關鍵詞就是“預測”。
預測營銷能夠讓你專注于一小群客戶,而這群客戶卻能代表特定產品的大多數潛在買家。以上圖為例,你可以將營銷活動的目標受眾鎖定為 20 萬潛在客戶或現有客戶,其中包括特定產品的大多數買家(4 萬人)。你還可以撥出部分預算用于吸引更小的客戶群(比如 20% 的客戶),而不是整個客戶群,進而優(yōu)化你的支出。
過去我們看數據可能是被動的方式,但預測營銷強調是決策價值,比如購買時間,你該看的不是她最后的購買日期,而是下次購買的時間,看未來的存活概率,最后生成客戶終身價值(CLV)。預測營銷催生了一種新的數據驅動營銷方式,就是以客戶為中心,核心在于幫助公司完成從以產品或渠道為中心到以客戶為中心的轉變。
DT學院:在現代商業(yè)中大數據的價值體現在哪?
董 飛:大數據最大的價值不是事后分析,而是預測和推薦。我就拿電商舉例,"精準推薦"成為大數據改變零售業(yè)的核心功能。譬如服裝網站Stitch fix例子,在個性化推薦機制方面,大多數服裝訂購網站采用的都是用戶提交身形、風格數據+編輯人工推薦的模式,Stitch Fix不一樣的地方在于它還結合了機器算法推薦。這些顧客提供的身材比例,主觀數據,加上銷售記錄的交叉核對,挖掘每個人專屬的服裝推薦模型。 這種一對一營銷是最好的服務。
數據整合改變了企業(yè)的營銷方式,現在經驗已經不是累積在人的身上,而是完全依賴消費者的行為數據去做推薦。未來,銷售人員不再只是銷售人員,而能以專業(yè)的數據預測,搭配人性的親切互動推薦商品,升級成為顧問型銷售。
DT學院:能舉個例子說明精準營銷的好處么?
董 飛:“顛覆營銷”書中提到一個例子,可以引述一下,大家思考一個問題:如果你打算搜集200份有效問卷,依照以往的經驗,你需要發(fā)多少份問卷,才能達到這個目標?預計用多少預算和時間來執(zhí)行?
以往的方法是這樣的:評估網絡問卷大約是5%的回收率,想要保證收到200份的問卷,就必須有20倍的發(fā)送量,也就是發(fā)出4000份問卷,一個月內如果可以回收,就是不錯的表現。
但現在不一樣了,在執(zhí)行大數據分析的3小時內,就可以輕松完成以下的目標:
1. 精準挑選出1%的VIP顧客
2. 發(fā)送390份問卷,全部回收
3. 問卷寄出3小時內回收35%的問卷
4. 5天內就回收了超過目標數86%的問卷數
5. 所需時間和預算都在以往的10%以下
這是怎么做到在問卷發(fā)送后的3個小時就回收35% 那是因為數據做到了發(fā)送時間的"一對一定制化",利用數據得出,A先生最可能在什么時間打開郵件就在那個時間點發(fā)送問卷。舉例來說,有基人在上班路上會打開郵件,但如果是開車族,并沒有時間填寫答案,而搭乘公共交通工具的人,上班路上的時間會玩手機,填寫答案的概率就高,這些都是數據細分受眾的好處。
DT學院:如何生成用戶的精準畫像?
董 飛:大致分成三步:1. 采集和清理數據:用已知預測未知;2. 用戶分群:分門別類貼標簽;3. 制定策略:優(yōu)化再調整。
§ 采集和清理數據:用已知預測未知
首先得掌握繁雜的數據源。包括用戶數據、各式活動數據、電子郵件訂閱數、線上或線下數據庫及客戶服務信息等。這個是累積數據庫;這里面最基礎的就是如何收集網站/APP用戶行為數據。比如當你登陸某網站,其Cookie就一直駐留在瀏覽器中,當用戶觸及的動作,點擊的位置,按鈕,點贊,評論,粉絲,還有訪問的路徑,可以識別并記錄他/她的所有瀏覽行為,然后持續(xù)分析瀏覽過的關鍵詞和頁面,分析出他的短期需求和長期興趣。還可以通過分析朋友圈,獲得非常清晰獲得對方的工作,愛好,教育等方面,這比個人填寫的表單,還要更全面和真實。
我們用已知的數據尋找線索,不斷挖掘素材,不但可以鞏固老會員,也可以分析出未知的顧客與需求,進一步開發(fā)市場。
§ 用戶分群:分門別類貼標簽
描述分析是最基本的分析統(tǒng)計方法,描述統(tǒng)計分為兩大部分:數據描述和指標統(tǒng)計。數據描述:用來對數據進行基本情況的刻畫,包括數據總數,范圍,數據來源。指標統(tǒng)計:把分布,對比,預測指標進行建模。這里常常是Data mining的一些數學模型,像響應率分析模型,客戶傾向性模型,這類分群使用Lift圖,用打分的方法告訴你哪一類客戶有較高的接觸和轉化的價值。
在分析階段,數據會轉換為影響指數,進而可以做"一對一"的精準營銷。舉個例子,一個80后客戶喜歡在生鮮網站上早上10點下單買菜,晚上6點回家做飯,周末喜歡去附近吃日本料理,經過搜集與轉換,就會產生一些標簽,包括"80后""生鮮""做飯""日本料理"等等,貼在消費者身上。
§ 制定策略:優(yōu)化再調整
有了用戶畫像之后,便能清楚了解需求,在實際操作上,能深度經營顧客關系,甚至找到擴散口碑的機會。例如上面例子中,若有生鮮的打折券,日本餐館最新推薦,營銷人員就會把適合產品的相關信息,精準推送這個消費者的手機中;針對不同產品發(fā)送推薦信息,同時也不斷通過滿意度調查,跟蹤碼確認等方式,掌握顧客各方面的行為與偏好。
除了顧客分群之外,營銷人員也在不同時間階段觀察成長率和成功率,前后期對照,確認整體經營策略與方向是否正確;若效果不佳,又該用什么策略應對。反復試錯并調整模型,做到循環(huán)優(yōu)化。這個階段的目的是提煉價值,再根據客戶需求精準營銷,最后追蹤客戶反饋的信息,完成閉環(huán)優(yōu)化。
我們從數據整合導入開始,聚合數據,在進行數據的分析挖掘。數據分析和挖掘還是有一些區(qū)別。數據分析重點是觀察數據,單純的統(tǒng)計,看KPI的升降原因。而數據挖掘從細微和模型角度去研究數據,從學習集,訓練集發(fā)現知識規(guī)則,除了一些比較商業(yè)化的軟件SAS,WEKA功能強大的數據分析挖掘軟件,這邊還是更推薦使用R,Python,因為SAS,SPSS本身比較昂貴,也很難做頁面和服務級別的API,而Python和R有豐富的庫,可以類似WEKA的模塊,無縫交互其他API和程序,這里還需要熟悉數據庫,Hadoop等。
在算法部分,我們通過相似度衡量聚類算法,主要核心是數據簡化,讓它具備大規(guī)模數據的能力,這里做變換,降維,抽樣。在分類這一塊,我們使用了決策樹,Boosting監(jiān)督的分類學習方法,隨機森林來解決回歸和分類問題。
DT學院:請談談你們公司目前怎么做精準營銷的,比如如何拉新和留存客戶?
董 飛:我們公司(Datatist)是專注于用大數據機器學習技術自動支持企業(yè)的智能決策和商業(yè)優(yōu)化。擁有外部營銷和內部營銷相結合的閉環(huán)一體化用戶運營優(yōu)化解決方案。
對于外部營銷優(yōu)化:通過機器學習內部客戶的特征,結合word2vec,神經網絡多種模型精準預測最可能轉化的潛在外部客戶。
對于內部營銷優(yōu)化:通過機器學習客戶的行為特征,精準預測最可能活躍的客戶,最可能購買的客戶等。并且通過內部觸達渠道刺激用戶轉化,A/B test,效果跟蹤和持續(xù)優(yōu)化等一站式解決方案提高內部客戶的轉化率。
我們模型使用的算法包括神經網絡,邏輯回歸,隨機森林和回歸樹,但這些對于營銷人員意義不大,重要的是,可能性模型是通過學習歷史行為來預測客戶未來動作的。下面在使用模型之前,訓練期和調試期使用歷史數據的方法。
拉新和留存是很多客戶最關心的,我們的做法是通過數據挖掘和機器學習的方式提升效率,并且兩者是有關聯(lián),通過內部留存每一步的跟蹤和轉化,我們可以刻畫用戶的精準畫像,對不同分類的客戶做不同刺激,預測可能轉化的用戶,并將特征記錄下來,對外部的拉新數據能夠重用。
以最常使用的電子郵件推送為例,以往只能盲目發(fā)送,消費者沒反應就再發(fā)一次。導入大數據分析后,可以很精準地掌握消費者的打開情況,消費者沒有點開閱讀一定有原因,一種策略是規(guī)劃促銷活動,再次發(fā)送給沒點開的消費者,觀察哪些消費者對促銷內容有反應,不斷回饋修正。 還有一種策略是建立每個消費者的消費習慣周期,比如顧客A是每隔30天購買,顧客B每隔60天購買,那么通過建模,第30天是顧客A的最可能購買點,之后購買概率衰退,最好在30天前的那一周發(fā)送電子郵件提醒刺激。如果太早提醒還沒發(fā)現,太晚又錯過了。因此在適當的時機,營銷才能事半功倍。
總之,客戶的資源有限,如何將人、時間、金錢等資源得花在刀刃上?通過數據進行有效資源分配,可以降低營銷預算,只要在關鍵購買點觸動他們,就可以達到很好的效果。但是對于即將流失的顧客,就應該投入相對高的營銷預算,產生資源最大化的效果。
DT學院:預測性營銷的選擇方案有哪些呢?這里的開發(fā)用到哪些技術和工具?
董 飛:關于預測營銷的技術能力,有幾種選擇方案:1. 使用預測分析工作平臺,然后以某種方法將模型輸入活動管理工具; 2. 以分析為動力的預測性活動外包給市場服務提供商;3. 評估并購買一個預測營銷的解決方案,比如預測性營銷云和多渠道的活動管理工具。如下是我工作中常用的技術工具:
但無論哪條路,都要確定三項基本能力:
1. 連接不同來源的客戶數據,包括線上,線下,為預測分析準備好數據。
2. 分析客戶提供的數據,使用系統(tǒng)和定制預測模型,做高級分析。
3. 在正確時間,正確客戶,正確的場景出發(fā)正確行為,可能做交叉銷售,跨不同營銷系統(tǒng)。
DT學院:營銷領域有哪些預測模型?
董 飛:預測客戶購買可能性的行業(yè)標準是RFM模型(最近一次消費R,消費頻率F,消費金額M),但模型應用有限,本質是一個試探性方案,沒有統(tǒng)計和預測依據。“過去的成績不能保證未來的表現”,RFM只關注過去,不去將客戶當前行為和其他客戶當前行為做對比。這樣就無法在購買產品之前識別高價值客戶。我們聚焦的預測模型,就是為了在最短時間內對客戶價值產生最大影響。這里列舉一些其他模型參考:
§ 參與傾向模型 預測客戶參與一個品牌的可能性,參與定義可以多元,比如參加一個活動,打開電子郵件,點擊,訪問某頁面??梢酝ㄟ^模型來確定EDM的發(fā)送頻率。并對趨勢做預測,是增加還是減少活動。
§ 錢包模型 就是為每個客戶預測最大可能的支出,定義為單個客戶購買產品的最大年度支出。然后看增長模型,如果當前的總目標市場比較小,但未來可能很大,就需要去發(fā)現這些市場。
§ 價格優(yōu)化模型 就是能夠去最大限度提升銷售,銷量或利潤的架構,通過價格優(yōu)化模型為每個客戶來定價,這里需要對你想要的產品開發(fā)不同的模型,或者開發(fā)通用,可預測的客戶價格敏感度的模型,確定哪一塊報價時對客戶有最大的影響。
§ 關鍵字推薦模型 關鍵字推薦模型可以基于一個客戶網絡行為和購買記錄來預測對某個內容的喜愛程度,預測客戶對什么熱點,爆款感興趣,營銷者使用這種預測結果為特定客戶決定內容營銷主題。
§ 預測聚集模型 預測聚集模型就是預測客戶最終會歸為哪一類。
DT學院:目前對于預測性營銷技術,國際上有哪些技術創(chuàng)新和開發(fā)工具?目前的使用瓶頸和顧慮是什么?
董 飛:預測營銷技術以模型工具存在了很多年,比如一些統(tǒng)計分析軟件 SAS,SPSS,R,還有像Netflix,Amazon,Facebook,Ebay,電信領域Verizon,ATT這些大公司,都有數據科學家團隊,他們都在開發(fā)基于預測性的廣告和營銷系統(tǒng)。但這些工具都有一些重要的缺點,在你使用預測分析平臺之前,首先要把業(yè)務需求翻譯成技術需求,這樣數據科學家才能將其轉化為模型和查詢語句。
大多數市場營銷人員還是這方面能力不足,沒有工程師和商業(yè)分析師的支持的話,就要從頭做重復勞動,選擇適當模型,去解決商業(yè)問題。而數據科學家往往也局限在某個行業(yè)內,找到合適的人才非常難,也很難跨行業(yè)獲得經驗。
在使用大數據平臺時,往往要求在以下方面:整合數據,準備數據,開發(fā),測試,配置模型,IT設施和數據架構都需要持續(xù)配合,才能最后幫助運營者生成報告并準備活動的名單。比如筆者當時在LinkedIn的廣告部門,我們的數據科學家建立了一套強大的分析算法去計算預估CTR,預估bid price,預估受眾,但一旦脫離了LinkedIn的網站,廣告主也沒辦法重復分析和得到持續(xù)的預測評分,而每個公司重新搭建一套大數據平臺也是費時費力。
另外在個人信息使用上要特別注意隱私問題,顧客心理會有一些心理差異,比如客戶的電話,郵箱注冊某品牌電商(Tiffany)后,收到一些競爭對手如香奈兒不停給你發(fā)送廣告,你也許會很生氣。根據消費者報告,有71%的人認為,他們擔心電商在不經過她們同意就出售或分享信息,因為越來越多的營銷者從使用第三方的信息記錄轉向使用第一方數據來進行營銷。
還有個“最后一公里”問題,比如說“我們拿到了網站注冊的大量信息,也通過模型預測出來最有可能購買的客戶,但作為運營人員,我無法根據客戶分享給我的偏好和日期去發(fā)布一個Campaign(促銷)”,就是說預測模型的輸出結果對于營銷人員來說很難使用-- 無法將日常的郵件,廣告,門店和客戶互動等營銷活動結合起來。這也是Datatist想解決的一個客戶痛點,在二月份我們將發(fā)布一站式的營銷云產品。
DT學院:機器學習技術在預測營銷領域是如何應用,會有怎樣的發(fā)展?
董 飛:去年人工智能特別火,特別是深度學習在機器視覺,語言識別,游戲AI上的突飛猛進,以至于人們開始恐慌人工智能是不是已經可以接管人類工作,我個人是對新技術有著強烈的興趣,也非??春眯驴萍?,數據與現實的關聯(lián)。
注:
本文由 DT學院 投稿數據猿發(fā)布。
歡迎更多大數據企業(yè)、愛好者投稿數據猿,來稿請直接投遞至:tougao@datayuan.cn
來源:數據猿
我要評論
活動推薦more >
- 2018 上海國際大數據產業(yè)高2018-12-03
- 2018上海國際計算機網絡及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術峰會2018”2018-06-14