【每周一本書(shū)】之《大數(shù)據(jù)核心技術(shù)與實(shí)用算法》
原創(chuàng) abby | 2017-12-19 07:57
【數(shù)據(jù)猿導(dǎo)讀】 大數(shù)據(jù)技術(shù)與應(yīng)用展現(xiàn)出銳不可當(dāng)?shù)膹?qiáng)大生命力,科學(xué)界與企業(yè)界寄予無(wú)比的厚望。大數(shù)據(jù)成為繼20世紀(jì)末21世紀(jì)初互聯(lián)網(wǎng)蓬勃發(fā)展以來(lái)的又一輪IT工業(yè)革命

來(lái)源:數(shù)據(jù)猿 作者:abby
大數(shù)據(jù)技術(shù)與應(yīng)用展現(xiàn)出銳不可當(dāng)?shù)膹?qiáng)大生命力,科學(xué)界與企業(yè)界寄予無(wú)比的厚望。大數(shù)據(jù)成為繼20世紀(jì)末21世紀(jì)初互聯(lián)網(wǎng)蓬勃發(fā)展以來(lái)的又一輪IT工業(yè)革命。
大數(shù)據(jù)技術(shù)是指從數(shù)據(jù)采集、清洗、集成、挖掘、分析與結(jié)果解釋?zhuān)M(jìn)而從各種類(lèi)型的巨量數(shù)據(jù)中快速獲得有價(jià)值信息的全部技術(shù)。從數(shù)據(jù)挖掘和分析中,人們可以獲取具有重要價(jià)值的信息。大數(shù)據(jù)技術(shù)的精髓是從大數(shù)據(jù)中產(chǎn)生新見(jiàn)解的能力、識(shí)別復(fù)雜關(guān)系和做出越來(lái)越精準(zhǔn)的預(yù)測(cè)、從大數(shù)據(jù)中產(chǎn)生動(dòng)力、獲取知識(shí)和采取行動(dòng)的能力。
大數(shù)據(jù)技術(shù)是現(xiàn)代科學(xué)與技術(shù)發(fā)展,尤其是計(jì)算機(jī)科學(xué)技術(shù)發(fā)展的重要成果和結(jié)晶,是科學(xué)發(fā)展史的又一新的里程碑。大數(shù)據(jù)的出現(xiàn)對(duì)計(jì)算機(jī)科學(xué)技術(shù)的許多領(lǐng)域提出了挑戰(zhàn)與沖擊,推動(dòng)了IT技術(shù)的發(fā)展。
而今天,小編就要為大家推薦一本關(guān)于大數(shù)據(jù)技術(shù)的入門(mén)讀物——《大數(shù)據(jù)核心技術(shù)與實(shí)用算法》。
從內(nèi)容方面,該書(shū)共分為12個(gè)章節(jié):
第一章:大數(shù)據(jù)技術(shù)概述,主要包括大數(shù)據(jù)技術(shù)框架、特征、大數(shù)據(jù)的沖擊、大數(shù)據(jù)研究方法論、常用的大數(shù)據(jù)計(jì)算框架。
第二章:大數(shù)據(jù)獲取與存儲(chǔ),主要包括數(shù)據(jù)獲取的定義與數(shù)據(jù)獲取領(lǐng)域、NewSQL和NoSQL、分布式文件系統(tǒng)、虛擬存儲(chǔ)技術(shù)、云存儲(chǔ)技術(shù)、分布式存儲(chǔ)核心算法、數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)集市、區(qū)塊鏈技術(shù)等。
第三章:大數(shù)據(jù)抽取技術(shù),主要包括數(shù)據(jù)抽取技術(shù)概述、增量數(shù)據(jù)抽取技術(shù)、非結(jié)構(gòu)化數(shù)據(jù)抽取、Web數(shù)據(jù)抽取。
第四章:大數(shù)據(jù)清洗技術(shù),主要包括數(shù)據(jù)質(zhì)量與數(shù)據(jù)清洗、不完整數(shù)據(jù)清洗方法、異常數(shù)據(jù)清洗方法、重復(fù)數(shù)據(jù)清洗方法、文本清洗和數(shù)據(jù)清洗技術(shù)的實(shí)現(xiàn)。
第五章:大數(shù)據(jù)轉(zhuǎn)換與約簡(jiǎn),主要包括數(shù)據(jù)平滑、數(shù)據(jù)規(guī)范化、數(shù)據(jù)泛化、數(shù)據(jù)約簡(jiǎn)、數(shù)據(jù)壓縮、數(shù)值約簡(jiǎn)、數(shù)值數(shù)據(jù)離散化與概念分層。
第六章:大數(shù)據(jù)集成技術(shù),主要包括數(shù)據(jù)集成技術(shù)概述,數(shù)據(jù)遷移、數(shù)據(jù)集成模式、數(shù)據(jù)集成系統(tǒng)、數(shù)據(jù)集成系統(tǒng)的構(gòu)建、數(shù)據(jù)聚類(lèi)集成、實(shí)時(shí)數(shù)據(jù)集成、企業(yè)信息集成。
第七章:大數(shù)據(jù)分析技術(shù),主要包括大數(shù)據(jù)分析定義與方法、數(shù)據(jù)分析的基本方法、高級(jí)數(shù)據(jù)分析、預(yù)測(cè)分析、大數(shù)據(jù)預(yù)測(cè)分析的應(yīng)用趨勢(shì)。
第八章:數(shù)據(jù)挖掘,主要包括數(shù)據(jù)挖掘理論基礎(chǔ)、關(guān)聯(lián)規(guī)則挖掘、分類(lèi)、聚類(lèi)方法、序列模式挖掘、Web挖掘技術(shù)、空間數(shù)據(jù)挖掘、非結(jié)構(gòu)化文本數(shù)據(jù)挖掘。
第九章:大數(shù)據(jù)分析結(jié)果解釋?zhuān)饕〝?shù)據(jù)分析結(jié)果的解釋、數(shù)據(jù)的基本展現(xiàn)形式、大數(shù)據(jù)可視化、大數(shù)據(jù)可視分析。
第十章:大數(shù)據(jù)離線計(jì)算技術(shù),主要包括數(shù)據(jù)離線計(jì)算概述、MapReduce的體系結(jié)構(gòu)、Hadoop分布式計(jì)算平臺(tái)、MapReduce程序設(shè)計(jì)實(shí)例。
第十一章:大數(shù)據(jù)流式計(jì)算技術(shù)。
第十二章:大數(shù)據(jù)交互式處理技術(shù),主要包括交互式處理系統(tǒng)的問(wèn)題、數(shù)據(jù)切分、數(shù)據(jù)鉆取、Scala編程語(yǔ)言簡(jiǎn)介、交互式大數(shù)據(jù)處理框架Spark、交互式查詢(xún)。
推薦閱讀:
【每周一本書(shū)】之《人之彼岸》:郝景芳帶你提前踏入人機(jī)交互的未知世界
【每周一本書(shū)】之《數(shù)據(jù)素養(yǎng):數(shù)據(jù)使用指南》:如何將數(shù)據(jù)信息轉(zhuǎn)變?yōu)槊匀说墓适拢?/span>
【每周一本書(shū)】之《圖解機(jī)器學(xué)習(xí)》:187張圖解輕松入門(mén)
【每周一本書(shū)】之《大數(shù)據(jù)智能——互聯(lián)網(wǎng)時(shí)代的機(jī)器學(xué)習(xí)和自然語(yǔ)言處理技術(shù)》
【每周一本書(shū)】之《大數(shù)據(jù)日知錄:架構(gòu)與算法》
點(diǎn)擊查看更多大數(shù)據(jù)書(shū)籍……
本書(shū)由 數(shù)據(jù)猿聯(lián)合北京師范大學(xué)出版社 共同推薦
【本欄目合作伙伴】:清華大學(xué)出版社、電子工業(yè)出版社、北京師范大學(xué)出版社、中國(guó)人民大學(xué)出版社、中信出版社、上海交通大學(xué)出版社。
歡迎更多合作伙伴加入!也歡迎勾搭小編,微信:wmh4178,備注“書(shū)”
刷新相關(guān)文章
我要評(píng)論
人物專(zhuān)訪more >
活動(dòng)推薦more >
- 2018 上海國(guó)際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國(guó)際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國(guó)國(guó)際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)2018-06-21
- “無(wú)界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過(guò)的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車(chē)
-
4數(shù)據(jù)智能 無(wú)限未來(lái)—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
10#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新