【每周一本書】之《數(shù)據(jù)可視化與數(shù)據(jù)挖掘》:基于Tableau和SPSS Modeler圖形界面
原創(chuàng) abby | 2018-01-16 07:59
【數(shù)據(jù)猿導讀】 大數(shù)據(jù)時代正在改變著我們的生活、工作和思維,要讓大數(shù)據(jù)發(fā)揮出最大價值,最重要的手段就是進行數(shù)據(jù)可視化挖掘。利用可視化數(shù)據(jù)挖掘工具和技術,分析人員能夠從全新的角度快速、輕松地挖掘信息。可視化數(shù)據(jù)挖掘使數(shù)據(jù)挖掘變得更簡單,建模過程不需要編寫代碼,非技術出身的業(yè)務人員等也...

來源:數(shù)據(jù)猿 作者:abby
當前,經典的數(shù)據(jù)挖掘算法日趨成熟,相關標準和技術已經在各行各業(yè)得到廣泛應用。為了使數(shù)據(jù)挖掘技術滿足不同層次用戶的需要,可視化數(shù)據(jù)挖掘技術被提出,通過可視化的手段將數(shù)據(jù)挖掘過程的各個階段展示給用戶,使用戶能更好地理解過程,目前該技術已經成為數(shù)據(jù)挖掘領域的研究熱點。
今天小編為大家推薦的《數(shù)據(jù)可視化與數(shù)據(jù)挖掘——基于Tableau和SPSS Modeler圖形界面》就旨在為讀者介紹最新的可視化數(shù)據(jù)挖掘技術。本書內容主要基于 Tableau 10.3和 IBM SPSS Modeler 18.0 編寫,詳細介紹了 Tableau 的數(shù)據(jù)連接、圖形編輯、創(chuàng)建地圖、表計算和聚合計算等功能,以及 IBM SPSS Modeler 的數(shù)據(jù)連接、CRISP-DM(跨行業(yè)數(shù)據(jù)挖掘標準流程)等功能。通過實際案例,重點介紹了可視化數(shù)據(jù)挖掘技術在電信、電力、醫(yī)藥、銀行、電商和房地產等行業(yè)中的應用,可以作為互聯(lián)網、銀行證券、電商等行業(yè)的從業(yè)者,以及高等院校相關專業(yè)學生參考使用。
大數(shù)據(jù)時代正在改變著我們的生活、工作和思維,要讓大數(shù)據(jù)發(fā)揮出最大價值,最重要的手段就是進行數(shù)據(jù)可視化挖掘。利用可視化數(shù)據(jù)挖掘工具和技術,分析人員能夠從全新的角度快速、輕松地挖掘信息??梢暬瘮?shù)據(jù)挖掘使數(shù)據(jù)挖掘變得更簡單,建模過程不需要編寫代碼,非技術出身的業(yè)務人員等也可以利用數(shù)據(jù)做出決策。
本書從內容方面主要分為15個章節(jié):
第1章:介紹數(shù)據(jù)可視化和可視化數(shù)據(jù)挖掘的基本理論及主要軟件,前者包括Tableau、QlikView和Power BI,后者包括IBM SPSS Modeler、Intelligent Miner和SAS Enterprise Miner。
第2章:介紹Tableau Desktop 10.3軟件簡介、數(shù)據(jù)類型、運算符及優(yōu)先級、軟件的安裝與激活和Tableau的文件類型等。
第3章:介紹Tableau Desktop可以連接的數(shù)據(jù)源,包括Excel文件、文本文件、Access文件、JSON文件、PDF文件、空間文件和統(tǒng)計文件等,還介紹了如何連接各類數(shù)據(jù)庫,如Tableau Server、SQL Server、MySQL和Oracle等。
第4章:首先介紹Tableau Desktop的維度和度量、連續(xù)和離散的概念和操作,然后介紹工作區(qū)和工作表的基礎操作,最后詳細介紹表計算、創(chuàng)建字段、創(chuàng)建參數(shù)和聚合計算等高級操作。
第5章:介紹如何使用Tableau生成一些統(tǒng)計圖形,如條形圖、餅圖、直方圖、折線圖、散點圖、并排圖、甘特圖等。
第6章:介紹IBM SPSS Modeler的發(fā)展歷史、軟件特點、軟件算法、軟件功能、安裝過程和授權許可等。
第7章:介紹使用IBM SPSS Modeler進行數(shù)據(jù)挖掘的6個基本步驟:業(yè)務理解、數(shù)據(jù)理解、數(shù)據(jù)準備、建立模型、評估模型和應用模型。
第8章:介紹IBM SPSS Modeler的基本操作,包括連接到文件和連接到數(shù)據(jù)庫,前者包括Excel文件、SAS文件、SPSS Statistics文件、變量文件和固定文件等,后者包括Oracle、SQL Server、DB2、MySQL等數(shù)據(jù)庫。
第9章:介紹IBM SPSS Modeler的數(shù)據(jù)流操作,包括生成數(shù)據(jù)流、添加和刪除節(jié)點、連接數(shù)據(jù)流、修改連接節(jié)點和執(zhí)行數(shù)據(jù)流等。
第10章:介紹可視化數(shù)據(jù)挖掘在電信行業(yè)中的應用,根據(jù)客戶流失數(shù)據(jù),運用Logistic回歸算法,建立了基于客戶屬性、服務屬性和客戶消費信息的客戶流失預警模型。
第11章:介紹可視化數(shù)據(jù)挖掘在電力行業(yè)中的應用,由于用電負荷具有季節(jié)性和周期性的特點,因此運用時間序列模型,同時選擇時間序列中的專家建模器進行建模。
第12章:介紹可視化數(shù)據(jù)挖掘在醫(yī)藥行業(yè)中的應用,根據(jù)患者的用藥數(shù)據(jù),應用K-Means聚類算法,建立基于藥物在人體的類膽固醇TC、Na、Ka等因素的藥物效果聚類模型。
第13章:介紹可視化數(shù)據(jù)挖掘在銀行業(yè)中的應用,根據(jù)銀行客戶的登記記錄數(shù)據(jù),運用判別分析算法,建立基于客戶的屬性數(shù)據(jù)、信用等級和資產狀況等因素的客戶類型判別模型。
第14章:介紹可視化數(shù)據(jù)挖掘在電商行業(yè)中的應用,根據(jù)促銷的費用、促銷前的銷售額和促銷后的銷售額等數(shù)據(jù),運用神經網絡模型,建立基于促銷費用、促銷前的銷售額和促銷后的銷售額等因素的促銷效果評價模型。
第15章:介紹可視化數(shù)據(jù)挖掘在房地產行業(yè)中的應用,根據(jù)購房者的個人信息數(shù)據(jù)等,運用CHAID決策樹算法,建立基于年齡、性別、學歷、月薪和家庭人數(shù)等因素的購房決策樹模型。
適度人群
本書的內容和案例適用于互聯(lián)網、銀行證券、電商、醫(yī)藥等行業(yè)數(shù)據(jù)分析用戶進行可視化數(shù)據(jù)挖掘,可供高等院校相關專業(yè)學生及從事可視化數(shù)據(jù)挖掘的研究人員參考使用,也可作為Tableau和IBM SPSS Modeler軟件培訓和自學的教材。
推薦閱讀:
【每周一本書】之《人之彼岸》:郝景芳帶你提前踏入人機交互的未知世界
【每周一本書】之《數(shù)據(jù)素養(yǎng):數(shù)據(jù)使用指南》:如何將數(shù)據(jù)信息轉變?yōu)槊匀说墓适拢?/span>
【每周一本書】之《大數(shù)據(jù)智能——互聯(lián)網時代的機器學習和自然語言處理技術》
【每周一本書】之《大數(shù)據(jù)日知錄:架構與算法》
點擊查看更多大數(shù)據(jù)書籍……
本書由 數(shù)據(jù)猿聯(lián)合電子工業(yè)出版社 共同推薦
【本欄目合作伙伴】:清華大學出版社、電子工業(yè)出版社、北京師范大學出版社、中國人民大學出版社。
歡迎更多合作伙伴加入!也歡迎勾搭小編,微信:wmh4178,備注“書”
來源:數(shù)據(jù)猿
刷新相關文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產業(yè)高2018-12-03
- 2018上海國際計算機網絡及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費金融國際峰會62018-06-21
- 第五屆FEA消費金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關于醫(yī)
-
2數(shù)據(jù)軟件產品和服務商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
4數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風起云涌時,共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風險感知
-
7#榜樣的力量#內蒙古自治區(qū)互聯(lián)網醫(yī)療服
-
8#榜樣的力量#實時新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
10#后疫情時代的新思考#構建工業(yè)互聯(lián)網新