袁帥:方差在數(shù)據(jù)驅(qū)動(dòng)企業(yè)運(yùn)營(yíng)管理中的應(yīng)用
【數(shù)據(jù)猿導(dǎo)讀】 在介紹描述性分析中曾介紹提到過(guò)針對(duì)不同的因素或者變量做進(jìn)一步科學(xué)的評(píng)測(cè),需要利用到統(tǒng)計(jì)學(xué)分析中的方差,今天將就方差如何在銷售管理分析中應(yīng)用做更加詳細(xì)的介紹和闡述。

方差分析是從分析數(shù)據(jù)的差異入手,分析哪些因素是影響數(shù)據(jù)差異的眾多因素中的主要因素,從而設(shè)計(jì)出最優(yōu)的方案。
如何獲得最佳的產(chǎn)品銷售量:哪些因素是影響銷售量的主要因素,哪些因素的那種情況更利于提高銷售量,哪些因素的組合更利于提高銷售量可以利用方差分析的方法來(lái)實(shí)現(xiàn)。方差在銷售管理管理數(shù)據(jù)分析中,需要先明確幾個(gè)核心概念:
觀測(cè)變量:作為觀測(cè)的對(duì)象(如:銷售量、成交量等);
控制因素:人為可以控制的因素(如:服務(wù)品類、產(chǎn)品種類、銷售價(jià)格、銷售策略等);
隨機(jī)因素:人為很難控制的因素(如:銷售人員的素質(zhì)、地域文化、同類競(jìng)品等因素)。
在知曉了幾個(gè)核心概念后,我們需要通過(guò)分析解決的是:
觀測(cè)變量的數(shù)據(jù)差異變化=控制因素+隨機(jī)因素,這是方差分析的核心。當(dāng)控制因素對(duì)觀測(cè)變量結(jié)果有顯著影響時(shí),和隨機(jī)因素共同作用將必然使得觀測(cè)變量發(fā)生更為顯著的變動(dòng),反之,觀測(cè)變量的變動(dòng)較小,將歸結(jié)為隨機(jī)變量造成的。
下面我們來(lái)看一個(gè)具體的例子(該例子延續(xù)之前分享文章中的示例)
為了對(duì)幾個(gè)行業(yè)的對(duì)某公司同一產(chǎn)品成交的情況進(jìn)行評(píng)價(jià),該公司數(shù)據(jù)分析組在四個(gè)行業(yè)分別抽取了不同的企業(yè)作為樣本。 從數(shù)據(jù)表中,我們要分析得到:分析四個(gè)行業(yè)之間的對(duì)同一產(chǎn)品的成交購(gòu)買是否有顯著差異,也就是要判斷“行業(yè)”對(duì)“產(chǎn)品成交”是否有顯著影響。如何作出這種判斷最終被歸結(jié)為檢驗(yàn)這四個(gè)行業(yè)產(chǎn)品購(gòu)買成交數(shù)的均值是否相等,若它們的均值相等,則意味著“行業(yè)”對(duì)產(chǎn)品購(gòu)買成交是沒(méi)有影響的,即它們之間對(duì)產(chǎn)品的需求使用沒(méi)有顯著差異;若均值不全相等,則意味著“行業(yè)”對(duì)產(chǎn)品購(gòu)買是有影響的,它們之間對(duì)產(chǎn)品需求是有顯著差異的。
因?yàn)槲覀円治鲂袠I(yè)對(duì)產(chǎn)品購(gòu)買成交數(shù)是否有影響,行業(yè)就是要檢驗(yàn)的因素,零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)就是因子的水平,因子的不同表現(xiàn),反映著觀察值:每個(gè)行業(yè)的產(chǎn)品成交購(gòu)買數(shù)量的變化。
行業(yè)與產(chǎn)品購(gòu)買成交有一定的關(guān)系,如果行業(yè)與產(chǎn)品購(gòu)買成交之間沒(méi)有關(guān)系,那么它們的購(gòu)買次數(shù)應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近當(dāng)然,僅從散點(diǎn)圖上觀察還不能提供充分的證據(jù)證明不同行業(yè)與產(chǎn)品購(gòu)買成交有顯著差異畢竟這種差異也可能是由于抽樣的隨機(jī)性所造成的因此我們需要有更準(zhǔn)確的方法來(lái)檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析,方差是通過(guò)對(duì)數(shù)據(jù)誤差來(lái)源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時(shí),需要考察數(shù)據(jù)誤差的來(lái)源,誤差來(lái)源分為:隨機(jī)誤差和系統(tǒng)誤差。
隨機(jī)誤差:因素的同一水平下,樣本各觀察值之間的差異,比如,同一行業(yè)下不同時(shí)間點(diǎn)產(chǎn)品購(gòu)買成交數(shù)量是不同的,這種差異可以看成是隨機(jī)因素的影響,稱為隨機(jī)誤差。系統(tǒng)誤差則是因素的不同水平下,各觀察值之間的差異,比如,不同行業(yè)之間的產(chǎn)品購(gòu)買成交數(shù)量之間的差異,這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差。
而數(shù)據(jù)的誤差在方差分析中則是用平方和來(lái)表示,平方和又分為組內(nèi)平方和:因素的同一水平下樣本數(shù)據(jù)的平方和,比如,零售業(yè)產(chǎn)品購(gòu)買成交量的誤差平方和,要明確組內(nèi)平方和只包含隨機(jī)誤差。組間平方和,因素的不同水平下各樣本之間的平方和,比如,四個(gè)行業(yè)同一產(chǎn)品購(gòu)買成交量之間的誤差平方和,組間平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差。
判斷行業(yè)對(duì)產(chǎn)品成交數(shù)量是否有顯著影響,也就是檢驗(yàn)產(chǎn)品銷售成交購(gòu)買次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差造成,說(shuō)明不同行業(yè)對(duì)該產(chǎn)品銷售成交有顯著的影響。那么要進(jìn)行方差分析我們先要完成幾個(gè)基本假設(shè):
每個(gè)總體都應(yīng)服從正態(tài)分布(感興趣的朋友可以自行去了解下什么是正態(tài)分布,其再統(tǒng)計(jì)學(xué)和概率學(xué)中具有著極其重要的地位),比如,每個(gè)行業(yè)產(chǎn)品購(gòu)買成交的次數(shù)必需服從正態(tài)分布;
各個(gè)總體的方差必須相同即各組觀察數(shù)據(jù)都是從具有相同方差的總體中抽取的,比如:四個(gè)行業(yè)的產(chǎn)品購(gòu)買成交量方差都相等;
觀察值是獨(dú)立的,比如:每個(gè)行業(yè)的產(chǎn)品購(gòu)買成交數(shù)量與其他行業(yè)的產(chǎn)品購(gòu)買成交數(shù)量是獨(dú)立的。
在上述的前提假定條件下,判斷行業(yè)對(duì)產(chǎn)品銷售交易成交量是否有顯著的影響,實(shí)際上也就是驗(yàn)證具有同方差的四個(gè)正態(tài)分布總體的均值是否相等,如果他們均值相等,則可以反倒出四個(gè)樣本的均值也會(huì)很接近。
提出問(wèn)題假設(shè)后,我們需要計(jì)算出:水平的均值、全部觀察值的總均值,誤差平方和,均方。
各誤差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對(duì)誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差(MS),計(jì)算方法是用誤差平方和除以相應(yīng)的自由度,SST 的自由度為n-1,其中n為全部觀察值的個(gè)數(shù);SSA的自由度為k-1,其中k為因素水平(總體)的個(gè)數(shù);SSE 的自由度為n-k
SST(總離差平方和)反映全部數(shù)據(jù)總的誤差程度;SSE(組內(nèi)平方和)反映隨機(jī)誤差的大小;SSA(組間平方和)反映隨機(jī)誤差和系統(tǒng)誤差的大小,如果原假設(shè)成立,則表明沒(méi)有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內(nèi)平方和SSE和除以自由度后的均方差異就不會(huì)太大;如果組間均方顯著地大于組內(nèi)均方,說(shuō)明各水平之間的差異不僅有隨機(jī)誤差,還有系統(tǒng)誤差,判斷因素的水平是否對(duì)其觀察值有影響,實(shí)際上就是比較組間方差與組內(nèi)方差之間差異的大小。那么通過(guò)上方計(jì)算得出的F值=MSA/MSE對(duì)比等于=3.406643,則數(shù)據(jù)分析得到,產(chǎn)品的銷售成交數(shù)量不僅與同一行業(yè)內(nèi)不同時(shí)間(隨機(jī)變量)有關(guān),也與不同行業(yè)(系統(tǒng)變量)有著關(guān)系。
通過(guò)計(jì)算我們能夠得出,SSA(組間平方和)對(duì)產(chǎn)品銷售成交量的影響效應(yīng)占總效應(yīng)的近35%,而SSE(組內(nèi)平方和)對(duì)產(chǎn)品銷售的成交量的比例達(dá)到了65%以上,而R=0.5914074,則表明了行業(yè)屬性與該產(chǎn)品的銷售成交量有著中等以上的關(guān)系,需要引起重要的重視。
方差的分析也分為:?jiǎn)我蛩胤讲罘治?,只考慮一個(gè)控制因素的影響;多因素方差分析,考慮兩個(gè)以上的控制因素和他們的交互作用;協(xié)方差分析,在盡量排除其他因素的影響下,分析單個(gè)或者多個(gè)控制因素對(duì)觀測(cè)變量的影響,這里面會(huì)引入?yún)f(xié)變量,而本文中介紹的是方差分析中的單因素方差分析方法,也是構(gòu)成方差分析的基礎(chǔ)。
在企業(yè)銷售分析運(yùn)營(yíng)管理過(guò)程中,我們往往會(huì)存在彼此相互辯解而爭(zhēng)執(zhí)的現(xiàn)象存在,比如:到底是地域的因素造成了銷售額的降低,還是銷售人員的個(gè)人工作能力原因造成的,亦或者是因?yàn)閮r(jià)格的因素影響的等等,與其在會(huì)上面紅耳赤,各說(shuō)各的道理,不如依據(jù)科學(xué)的數(shù)據(jù)分析方法,提出假設(shè),構(gòu)建樣本數(shù)據(jù),進(jìn)行方差分析,論證,尋求到到底是哪個(gè)因素帶來(lái)的更加大的影響,再針對(duì)性的調(diào)整策略,優(yōu)化,提升投入產(chǎn)出比,如開(kāi)篇中提到的,數(shù)據(jù)驅(qū)動(dòng)型企業(yè),一定要從企業(yè)根本的目標(biāo)點(diǎn)——銷售(創(chuàng)收)出發(fā),市場(chǎng)、運(yùn)營(yíng)、公關(guān)、渠道、行政等等企業(yè)內(nèi)部的管理經(jīng)營(yíng)終極目標(biāo)都是為了盈利,緊抓銷售轉(zhuǎn)化這一核心點(diǎn),以點(diǎn)帶動(dòng)面,再進(jìn)而帶動(dòng)整體,這也是我寫(xiě)數(shù)據(jù)驅(qū)動(dòng)企業(yè)管理系列文章,從銷售這一點(diǎn)開(kāi)始寫(xiě)起的原因。
方差的分析其實(shí)很復(fù)雜,有著更加深層次的統(tǒng)計(jì)學(xué)和概率學(xué)在其中,而作為企業(yè)的銷售或者運(yùn)營(yíng)中的職員,我們遠(yuǎn)不必要求自身達(dá)到專業(yè)的統(tǒng)計(jì)學(xué)背景出身或者數(shù)據(jù)分析專業(yè)人士的認(rèn)識(shí)和掌握的那種高度,能夠很好的利用和認(rèn)識(shí)單因素方差分析方法,并將其運(yùn)用到工作中,便已經(jīng)能夠具備極強(qiáng)的職場(chǎng)競(jìng)爭(zhēng)力了。
來(lái)源:36大數(shù)據(jù)
刷新相關(guān)文章
我要評(píng)論
活動(dòng)推薦more >
- 2018 上海國(guó)際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國(guó)際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國(guó)國(guó)際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)2018-06-21
- “無(wú)界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過(guò)的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車
-
4數(shù)據(jù)智能 無(wú)限未來(lái)—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
10#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新