什么是數(shù)據(jù)驅動?如何打造最強的數(shù)據(jù)驅動組織
Not_GOD | 2016-03-09 18:23
【數(shù)據(jù)猿導讀】 數(shù)據(jù)產品是社交網站的心臟。它們的數(shù)據(jù)必然是龐大的用戶數(shù)據(jù)集,形成的一張圖。也許對于社交網絡來說最重要的產品是某種幫助用戶鏈接彼此的工具。任何新的用戶需要找到新的伙伴,熟人或者聯(lián)系方式。讓用戶去搜索他們

數(shù)據(jù)驅動定義:
一個數(shù)據(jù)驅動的組織會以一種及時的方式獲取、處理和使用數(shù)據(jù)來創(chuàng)造效益,不斷迭代并開發(fā)新產品,以及在數(shù)據(jù)中探索(navigate)。
有很多方式可以評估一個組織是否為數(shù)據(jù)驅動的,如:
1. 產生的數(shù)據(jù)量
2. 使用數(shù)據(jù)的程度
3. 內化數(shù)據(jù)的過程
作者認為有效地(effectively)使用數(shù)據(jù)為關鍵。
商務公司擁有使用數(shù)據(jù)來改善效益的歷史。
任何好的銷售人員天性知道如何去向消費者推薦采購。
那些瀏覽過這些商品的客戶同樣瀏覽了另外一些東東……Amazon將該技術移至線上。
這種簡單的協(xié)同過濾的實現(xiàn)是Amazon諸多特性的一種。
這是一個對于傳統(tǒng)搜索之外的機緣巧合的強大的機制。
數(shù)據(jù)產品是社交網站的心臟。它們的數(shù)據(jù)必然是龐大的用戶數(shù)據(jù)集,形成的一張圖。也許對于社交網絡來說最重要的產品是某種幫助用戶鏈接彼此的工具。任何新的用戶需要找到新的伙伴,熟人或者聯(lián)系方式。讓用戶去搜索他們的朋友可不是一個好的用戶體驗。如同LinkedIn,工程師發(fā)明了People You May Know(PYMK)來解決這個問題。在理論上的確很容易完成這項工作,根據(jù)已經存在的關系圖,我們可以準確地發(fā)現(xiàn)新用戶的關系網絡。這樣的推薦朋友比自己去選擇更為高效。盡管PYMK現(xiàn)在很新穎,它卻已經成為了每個社交網站的必備部分。Facebook不僅支撐了自身版本的PYMK,他們還監(jiān)控了用戶獲得朋友的時間。使用精密的跟蹤和分析技術,他們已經標識了讓一個用戶長期參與的的時間和連接數(shù)。
如果你緩慢地鏈接一些朋友或者添加朋友,你將不會是一個長期依賴社交網絡的用戶。
通過學習達到信任的活動的層級,他們已經將網站設計成為能夠有效降低新人加一定數(shù)量朋友為其好友的時間。
類似地,Netflix在線電影事業(yè)完成了同樣的任務。當你注冊時,他們強烈推薦你添加你打算觀看的電影。他們的數(shù)據(jù)組已經發(fā)現(xiàn)一旦你增加超過某個數(shù)量的電影,你成為一個長期用戶的概率將大大增加。借助這個數(shù)據(jù),Netflix可以構造、測試和監(jiān)測產品流來最大化新人轉變?yōu)殚L期顧客的數(shù)量。他們已經簡化了高度優(yōu)化的注冊/試用服務,有效利用了這樣的信息來快速和高效地黏合客戶。
Netflix、LinkedIn和Facebook并不是僅有的使用用戶數(shù)據(jù)來鼓勵客戶的長期參與。如Zynga,它不僅僅關注游戲,還會常態(tài)化地監(jiān)測用戶身份和他們的行為,生成了一個不可思議的大數(shù)據(jù)。通過分析用戶在一段時間內在一個游戲中的交互行為,他們已經識別出那些直接導致成功游戲的特征。基于用戶和其他用戶的交互行為的數(shù)目、前n天內用戶建造的房子數(shù)目、在前m個小時內他們殺死了怪物的個數(shù)等等,他們便可以知道用戶將成為長期會員的概率的變化。他們找到了如何達成參與的挑戰(zhàn)的關鍵點,并已經設計出產品來鼓勵用戶達到這些目標。通過持續(xù)測試和監(jiān)測,他們優(yōu)化了對這些關鍵點的理解。
Google和Amazon在使用A/B測試來優(yōu)化網頁的展示方面是先行者。在互聯(lián)網發(fā)展歷史上,設計者門借助直覺和本能來完成工作。這沒有任何錯誤,但是如果你對一個頁面作出修改,你需要確保這個改動是有效的。你賣出更多的產品了么?用戶需要多久才能發(fā)現(xiàn)想要的東西?多少用戶放棄了并轉向了其他網站?這些問題只能借助實驗、收集和分析數(shù)據(jù)來完成,這些是數(shù)據(jù)驅動公司的第二特性。
Yahoo已經對數(shù)據(jù)科學作出了很多重要的貢獻。在看到Google使用MapReduce來分析海量數(shù)據(jù)后,他們認識到了自身需要同類的工具來完成自己事務這就是Hadoop,現(xiàn)在是數(shù)據(jù)科學家的最重要的一項工具之一。Hadoop已經由Cloudera,Hortonworks,MapR等公司商業(yè)化了。Yahoo并未停步于Hadoop,他們注意到流數(shù)據(jù)的重要性,而這是Hadoop不能給出很好的解決方案的。目前Yahoo致力于開源工具S4來解決流數(shù)據(jù)問題。
支付服務,如PayPal、Visa、American Express和Square,靠自身技術能力領先于對手。它們使用精密的欺詐檢測系統(tǒng)來發(fā)現(xiàn)數(shù)據(jù)中的異常行為模式。這些系統(tǒng)必須在毫秒級時間做出反應,其模型需要在新數(shù)據(jù)生成后實時更新。這工作就像在不斷堆疊新草的草堆中找出一根針那樣。
Google和其他搜索引擎常態(tài)地監(jiān)測搜索相關的度量來識別哪些情況是用戶只是在耍弄系統(tǒng)哪些情況可以幫助改進用戶體驗。Google所面臨的數(shù)據(jù)移動和處理的挑戰(zhàn)是巨大的,也許比目前所有其他的公司的都大。為了支撐其業(yè)務,他們不得不發(fā)明新穎的技術解決方案,從硬件到軟件如MapReduce再到算法如PageRank),其中很多方案的思想都已經流入開源軟件項目中。
最強的數(shù)據(jù)驅動組織的座右銘“If you can't measure it, you can't fix it”。這是從一個牛人那兒學來的。這個態(tài)度給人一種美妙的能力來傳達這種價值,其方式包括:
1. 產生和收集盡量多的數(shù)據(jù)。不管你是做商業(yè)智能還是構建產品,如果不能收集數(shù)據(jù),你就不能使用數(shù)據(jù)。
2. 以一種積極和省時的方式來度量你的產品或策略是否成功?如果你不去度量結果,你又如何得知呢?
3. 讓更多的人來觀察數(shù)據(jù)。任何問題可能只是因為一些簡單的原因導致。更多有經驗的專家可以從不同的角度迅速發(fā)現(xiàn)問題出在哪兒。
4. 刺激對數(shù)據(jù)產生變化或者不變的背后原因的好奇心。在一個數(shù)據(jù)驅動的組織,每個人都在思考數(shù)據(jù)。
當然,假裝自己是一個數(shù)據(jù)驅動的組織其實很簡單。但是如果你試著以上面的心態(tài)來收集數(shù)據(jù)和度量你能做到的每件事,思考自己收集的數(shù)據(jù)背后的意義,你將會超前于大多數(shù)只是嘴上說說的公司。并且我需要指出的是,當我在對專業(yè)的數(shù)據(jù)科學家介紹這些內容時,并未限制其他的人來了解這些知識。每個人都應該看看數(shù)據(jù)。
來源:簡書
刷新相關文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產業(yè)高2018-12-03
- 2018上海國際計算機網絡及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術峰會2018”2018-06-14