TalkingData:場景化重塑數(shù)據(jù)價(jià)值
謝軍 | 2017-08-10 11:17
【數(shù)據(jù)猿導(dǎo)讀】 近日,天翼智能生態(tài)博覽會(huì)于廣州順利落下帷幕。本屆博覽會(huì)以“智能創(chuàng)造未來”為主題,圍繞五大生態(tài)圈,設(shè)立了智能連接、智慧家庭、天翼物聯(lián)網(wǎng)、互聯(lián)網(wǎng)金融、云和大數(shù)據(jù)等5大主題展區(qū),全面展示了智能生態(tài)發(fā)展成果。

近日,天翼智能生態(tài)博覽會(huì)于廣州順利落下帷幕。本屆博覽會(huì)以“智能創(chuàng)造未來”為主題,圍繞五大生態(tài)圈,設(shè)立了智能連接、智慧家庭、天翼物聯(lián)網(wǎng)、互聯(lián)網(wǎng)金融、云和大數(shù)據(jù)等5大主題展區(qū),全面展示了智能生態(tài)發(fā)展成果。
TalkingData數(shù)據(jù)合作總經(jīng)理謝軍作為受邀嘉賓前往活動(dòng)現(xiàn)場,并在大數(shù)據(jù)分論壇與諸位嘉賓觀眾分享了題為《場景化重塑數(shù)據(jù)價(jià)值》的演講。
謝軍表示:全球各個(gè)行業(yè)的數(shù)據(jù)存儲(chǔ)量每年都在以50%的速度暴增,根據(jù)IDC的數(shù)據(jù)顯示:全球存儲(chǔ)量僅在2011年已達(dá)到1.8ZB, 預(yù)計(jì)2020年將超過40ZB。ZB,十萬億億字節(jié),這相當(dāng)于每個(gè)中國人每分鐘發(fā)3條微博,一共寫2.6976萬年才能完成。
然而數(shù)據(jù)的爆炸式增長,并不等同于價(jià)值的水到渠成。在我們以往的合作中,我們經(jīng)常能看到許多企業(yè)的數(shù)據(jù)不但沒有成為產(chǎn)生二次價(jià)值的資產(chǎn),還變成了花費(fèi)了高額的服務(wù)器及帶寬的成本項(xiàng)。DT時(shí)代,如何進(jìn)行數(shù)據(jù)的價(jià)值挖掘,已經(jīng)已經(jīng)成為企業(yè)必須面對(duì)的課題。
事實(shí)上,數(shù)據(jù)本身沒有價(jià)值,只有當(dāng)數(shù)據(jù)轉(zhuǎn)化為支撐決策的智慧,價(jià)值才得以體現(xiàn)。我們把數(shù)據(jù)價(jià)值化的過程抽象為四個(gè)階段:數(shù)據(jù)-信息-知識(shí)-智慧。從海量的數(shù)據(jù)中進(jìn)行分析洞察,將數(shù)據(jù)轉(zhuǎn)化為可讀易懂的信息,從信息中抽象出規(guī)律將其變?yōu)榭梢罁?jù)可遵循的知識(shí),最后通過知識(shí)輔助決策,解決實(shí)際問題。數(shù)據(jù)的進(jìn)階過程,始終需要一種能量貫穿始終,這就是場景化。
說到場景,我們很容易聯(lián)想到戲劇與電影的語境,“場”表示時(shí)間,“景”表示空間,場景是時(shí)間中的空間,是一幕幕時(shí)空片段。著名心理學(xué)家勒溫提出了一個(gè)抽象理論:一個(gè)人的行為取決于帶有個(gè)性的這個(gè)人與他所處環(huán)境的相互作用。即B=F(P*E)。其中E-Environment就是我們所說的場景,它包括周邊環(huán)境以及因此產(chǎn)生的心理環(huán)境。
讓我們用從數(shù)據(jù)業(yè)務(wù)的角度解讀這一公式:B-Behavior是企業(yè)所能撬動(dòng)的每一次用戶交互; P-Personality是帶有個(gè)性化標(biāo)簽的用戶個(gè)體; E-Environment則是構(gòu)建出的業(yè)務(wù)場景標(biāo)簽及業(yè)務(wù)感受標(biāo)簽。而這里的F就是數(shù)據(jù)科學(xué)家根據(jù)業(yè)務(wù)需求及場景構(gòu)建的算法;歸納來說就是在特定的場景中選擇特定的用戶群能夠更高概率的促成特定的行為交互。整個(gè)定式詮釋的正是場景化業(yè)務(wù)模型的生成法則,我們可以稱之為場景化模型定式。
當(dāng)我們把這一定式靈活的運(yùn)用到數(shù)據(jù)業(yè)務(wù)中,你會(huì)發(fā)現(xiàn)數(shù)據(jù)的組織思路非常清晰。無論是復(fù)雜的數(shù)據(jù)工程還是具體到數(shù)據(jù)業(yè)務(wù),都可以圍繞著B、P、E靈活開展。
說到數(shù)據(jù)工程,首先來看一下TalkingData 的數(shù)據(jù)工程流程閉環(huán),整個(gè)過程被分為四個(gè)階段:獲取、組織、分析、動(dòng)作,四個(gè)階段不是獨(dú)立分割,而是環(huán)環(huán)相扣。比如當(dāng)我們開始獲取數(shù)據(jù)的時(shí)候,就要去考慮最終收獲什么,對(duì)哪類業(yè)務(wù)起到促進(jìn)作用。同樣,當(dāng)我們用場景化標(biāo)簽進(jìn)行數(shù)據(jù)增強(qiáng)時(shí),業(yè)務(wù)指標(biāo)是拆分場景的方向盤。
從12年至今,TalkingData自身的數(shù)據(jù)工程支撐著每天2.5億的移動(dòng)端app活躍終端的數(shù)據(jù)更新及加工,同時(shí)數(shù)據(jù)平臺(tái)還接入了許多第三方公司的數(shù)據(jù)能力,進(jìn)行多源數(shù)據(jù)的場景化服務(wù)編織。我們幫眾多企業(yè)搭建了屬于他們自己的數(shù)據(jù)工程平臺(tái),完成了一方數(shù)據(jù)的價(jià)值重構(gòu),并為企業(yè)擴(kuò)展三方數(shù)據(jù)的能力,幫企業(yè)梳理場景、設(shè)計(jì)算法、定義價(jià)值模型。
我們堅(jiān)信:未來,能夠更好的應(yīng)用異構(gòu)的、情境化的數(shù)據(jù),能夠擁有更智能的算法,能夠駕馭智能數(shù)據(jù)的企業(yè)才更有市場競爭力。
聚焦到數(shù)據(jù)工程中的標(biāo)簽抽取,雖然數(shù)據(jù)雜亂無章,但抽取邏輯可以很清晰。我們依然套用剛才的場景化模型定式,標(biāo)簽實(shí)際上是找到可具體化的P、B、E。以人為中心,匯聚業(yè)務(wù)或場景的標(biāo)簽,再按業(yè)務(wù)或場景歸集,能夠形成一套精細(xì)化的行業(yè)(或業(yè)務(wù))標(biāo)簽體系。
在場景化標(biāo)簽的構(gòu)建過程中,P、B、E標(biāo)簽的快速重構(gòu)是標(biāo)簽庫能否靈活對(duì)接業(yè)務(wù)的關(guān)鍵,同時(shí)也是數(shù)據(jù)工程智能化的標(biāo)志之一。標(biāo)簽重構(gòu)最常用的方法是行為標(biāo)簽轉(zhuǎn)移。通過業(yè)務(wù)經(jīng)驗(yàn)、市場定位、綜合印象等,可形成針對(duì)特定“場景”的行為或人的認(rèn)知,當(dāng)遇到這些場景時(shí),我們不但可以給人打上場景標(biāo)簽,還可以給這類人打上一個(gè)關(guān)聯(lián)的行為標(biāo)簽或角色標(biāo)簽。
通過場景連接起的“人”與“行為”間的關(guān)系,可將“行為”或“人”的標(biāo)簽快速復(fù)制。除此之外我們還可以根據(jù)在固定場景中行為發(fā)生的頻次來構(gòu)建新的場景,如職住地標(biāo)簽;通過算法模型進(jìn)行行為預(yù)測或人群放大,從而把已知樣本的B、E、P標(biāo)簽擴(kuò)展到未知的目標(biāo)樣本上。
我們以上談到的數(shù)據(jù),是以人為本的場景域數(shù)據(jù),這部分是數(shù)據(jù)價(jià)值的核心。整個(gè)ETL的過程,就是場景化組織的過程,在組織數(shù)據(jù)的過程,除了人本數(shù)據(jù),我們還會(huì)遇到許多和人弱關(guān)聯(lián)的數(shù)據(jù),這部分?jǐn)?shù)據(jù)也需要找到與場景的關(guān)聯(lián),并被保存,為將來的場景延伸與業(yè)務(wù)探索打好基礎(chǔ)。
在實(shí)際業(yè)務(wù)運(yùn)營中,通過場景化模型定式依然可以清晰梳理出執(zhí)行邏輯。以數(shù)據(jù)營銷業(yè)務(wù)為例,客戶在確定B即業(yè)務(wù)目標(biāo)時(shí),會(huì)根據(jù)以往的業(yè)務(wù)經(jīng)驗(yàn)說出一些典型場景比,如**位置、**時(shí)間、**媒介等。而數(shù)據(jù)分析師需要根據(jù)目標(biāo)B進(jìn)行場景預(yù)測,或者說場景初始化,找出各類場景標(biāo)簽E及對(duì)應(yīng)的人的標(biāo)簽P,保證算法有足夠的變量,最終計(jì)算出高概率人群。
場景預(yù)測的過程是抽絲剝繭,數(shù)據(jù)分析師需要列出跟目標(biāo)B有關(guān)聯(lián)性的一系列小B動(dòng)作, 然后再推演出相應(yīng)的場景E與由用戶P,最后通過算法計(jì)算出可實(shí)現(xiàn)目標(biāo)B的最高概率人群P. 把用戶群P推進(jìn)業(yè)務(wù)場進(jìn)行驗(yàn)證,得到實(shí)際的轉(zhuǎn)化用戶,一個(gè)數(shù)據(jù)驅(qū)動(dòng)的閉環(huán)就基本完成。
多數(shù)情況下,初始的算法未必會(huì)讓客戶滿意,這時(shí)候就需要用機(jī)器代替人腦放大智慧,也就是我們今天常說的人工智能。通過機(jī)器學(xué)習(xí)對(duì)轉(zhuǎn)化用戶的行為、場景及人口屬性參數(shù)進(jìn)行歸納與優(yōu)化,動(dòng)態(tài)調(diào)整參數(shù)與權(quán)重,優(yōu)化算法路徑,生成最有效的業(yè)務(wù)模型。
除了人本數(shù)據(jù)的情景化運(yùn)營,事實(shí)上我們身邊許多數(shù)據(jù)換一種解讀模式,通過與設(shè)備或人建立關(guān)系,也可以發(fā)揮它的價(jià)值。比如氣象、旅游、物聯(lián)網(wǎng)等等。
今年TalkingData與康師傅聯(lián)合打造“做有溫度的零售店”,圍繞消費(fèi)者洞察和購物歷程,開展了人(客戶洞察、客戶情緒畫像)、貨(IOT技術(shù)、產(chǎn)品洞察)、場(內(nèi)場數(shù)據(jù)、外場數(shù)據(jù))三者之間互動(dòng)關(guān)系分析,打造了快消品企業(yè)首個(gè)運(yùn)營4P模型(客戶、產(chǎn)品、場景和定價(jià)的有機(jī)聯(lián)動(dòng))幫助零售店理解“我的到店顧客是誰 ”、感知“店內(nèi)顧客和商品溫度如何 ”,探求零售背后的營銷真相。
數(shù)據(jù)的價(jià)值挖掘,場景是關(guān)鍵,而場景從那里來,除了數(shù)據(jù)分析師大開腦洞外,我們更需要結(jié)合行業(yè)伙伴的能力一起探索。TalkingData始終懷揣開放的心態(tài),無論技術(shù)還是知識(shí)我們都愿意與合作伙伴共享。今年我們推出了與GoogleAwareness API無縫兼容的智能設(shè)備情境感知框架Myna,并且將此作為開源產(chǎn)品發(fā)布。
Myna可以調(diào)用設(shè)備的數(shù)據(jù)和傳感器來檢測用戶所處的狀態(tài)與情景,包括時(shí)間、位置(經(jīng)緯度)、地點(diǎn)、活動(dòng)、beacons信標(biāo)、耳機(jī)(插入/拔出)和天氣等。我們希望最大力度的推動(dòng)數(shù)據(jù)的智能化能力,幫助更多的企業(yè)用數(shù)據(jù)做決策;我們也希望攜同更多企業(yè)一同致力于通過數(shù)據(jù)改善人類自身及環(huán)境。
來源:數(shù)據(jù)觀-企業(yè)
刷新相關(guān)文章
我要評(píng)論
活動(dòng)推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國際峰會(huì)2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過的資訊
-
1【金猿案例展】中國銀聯(lián):以內(nèi)外聯(lián)動(dòng)的數(shù)
-
2全棧云原生產(chǎn)品戰(zhàn)略升級(jí),時(shí)速云領(lǐng)跑云原
-
3新趨勢·新未來 | 2019第六屆中國嬰幼
-
4【金猿產(chǎn)品展】中原銀行智能化BI:一站式
-
5【金猿產(chǎn)品展】易觀方舟:智能用戶數(shù)據(jù)中
-
6【金猿人物展】張涵誠: 2020年大數(shù)據(jù)產(chǎn)
-
7小飯桌2019全球青年創(chuàng)業(yè)者大會(huì)圓滿舉辦,
-
8繁華之下有隱憂,零售企業(yè)如何走出增長困
-
9【金猿產(chǎn)品展】羽扇決策引擎平臺(tái):運(yùn)籌帷
-
10【金猿案例展】國網(wǎng)上海市電力:智能配用