【每周一本書(shū)】之《大數(shù)據(jù)時(shí)代的算法:機(jī)器學(xué)習(xí)、人工智能及其典型實(shí)例》
原創(chuàng) abby | 2017-05-16 08:22
【數(shù)據(jù)猿導(dǎo)讀】 《大數(shù)據(jù)時(shí)代的算法:機(jī)器學(xué)習(xí)、人工智能及其典型實(shí)例》主要介紹了在互聯(lián)網(wǎng)行業(yè)中經(jīng)常涉及的算法,包括排序算法、查找算法、資源分配算法、路徑分析算法、相似度分析算法,以及與機(jī)器學(xué)習(xí)相關(guān)的算法,包括數(shù)據(jù)分類算法、聚類算法、預(yù)測(cè)與估算算法、決策算法、關(guān)聯(lián)規(guī)則分析算法及推薦算法

來(lái)源:數(shù)據(jù)猿 作者:abby
中國(guó)在很早就開(kāi)始了算法研究,如《周髀算經(jīng)》《九章算術(shù)》這類最具歷史的算法書(shū)籍,后來(lái)的唐宋元明清各歷史朝代也出現(xiàn)了《一位算法》《算法緒論》《算法全書(shū)》《算法統(tǒng)宗》等一系列算法名著,算法已經(jīng)成為各行各業(yè)的基礎(chǔ)研究。
今天,小編為大家推薦的《大數(shù)據(jù)時(shí)代的算法:機(jī)器學(xué)習(xí)、人工智能及其典型實(shí)例》就主要介紹了在互聯(lián)網(wǎng)行業(yè)中經(jīng)常涉及的算法,包括排序算法、查找算法、資源分配算法、路徑分析算法、相似度分析算法,以及與機(jī)器學(xué)習(xí)相關(guān)的算法,包括數(shù)據(jù)分類算法、聚類算法、預(yù)測(cè)與估算算法、決策算法、關(guān)聯(lián)規(guī)則分析算法及推薦算法。《大數(shù)據(jù)時(shí)代的算法:機(jī)器學(xué)習(xí)、人工智能及其典型實(shí)例》涉及的相關(guān)算法均為解決實(shí)際問(wèn)題中的主流算法,對(duì)于工作和學(xué)習(xí)都有實(shí)際參考意義。
《大數(shù)據(jù)時(shí)代的算法:機(jī)器學(xué)習(xí)、人工智能及其典型實(shí)例》通過(guò)介紹在互聯(lián)網(wǎng)行業(yè)中經(jīng)常涉及的算法,包括排序算法、查找算法、資源分配算法、路徑分析算法、相似度分析算法,以及與機(jī)器學(xué)習(xí)相關(guān)的算法,包括數(shù)據(jù)分類算法、聚類算法、預(yù)測(cè)與估算算法、決策算法、關(guān)聯(lián)規(guī)則分析算法及推薦算法。本書(shū)是一本算法領(lǐng)域內(nèi)的技術(shù)手冊(cè),涵蓋數(shù)十種算法,不僅能使讀者深入了解各類算法的基本理論,還從應(yīng)用的角度提供了大量實(shí)例,使讀者能夠快速、高效進(jìn)階各類算法,并能夠熟練應(yīng)用到將來(lái)的工作實(shí)踐中。
本書(shū)特色
本書(shū)不僅將目前工程應(yīng)用中主流的基礎(chǔ)算法和機(jī)器學(xué)習(xí)算法都做了詳盡的介紹,還囊括了當(dāng)前熱門(mén)算法內(nèi)容,如數(shù)據(jù)分類算法、聚類算法、推薦算法等。本書(shū)充分利用了最新算法的應(yīng)用研究結(jié)果,通過(guò)實(shí)例為讀者展現(xiàn)了清晰的算法應(yīng)用,不拘泥于算法枯燥的理論,更多地從實(shí)用價(jià)值、工程價(jià)值的角度將算法知識(shí)呈現(xiàn)給讀者。
本書(shū)中的算法可以廣泛應(yīng)用于各個(gè)領(lǐng)域,可以在自然語(yǔ)言處理研究、數(shù)據(jù)分析與挖掘、商務(wù)智能、廣告與商品推薦等領(lǐng)域中深入應(yīng)用。作者秉承數(shù)據(jù)結(jié)合算法產(chǎn)生價(jià)值的理論體系,在介紹算法的同時(shí)與數(shù)據(jù)緊密關(guān)聯(lián),并結(jié)合多年實(shí)際工作經(jīng)驗(yàn),將算法的內(nèi)容闡述得淋漓盡致。本書(shū)中的算法研究在當(dāng)前甚至未來(lái)相當(dāng)一段時(shí)間內(nèi)都具有很大的實(shí)際意義。
本書(shū)從內(nèi)容上分為10個(gè)章節(jié):
第1章 算法基礎(chǔ)
從算法的分析類型,如分治法、動(dòng)態(tài)規(guī)劃法、回溯法、分支限界法、貪心法入手開(kāi)始介紹算法內(nèi)容,還分析了算法的性能,并介紹了概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)部分的內(nèi)容。同時(shí),對(duì)算法中常用的距離計(jì)算算法、排序算法及字符串壓縮編碼也做了完整介紹。
第2章 數(shù)據(jù)查找與資源分配算法
以數(shù)據(jù)的查找和資源分配作為突破口,介紹了常用的數(shù)值查找算法,如二分搜索算法、分塊查找及哈希查找算法。除此之外,還介紹了常見(jiàn)的字符串查找算法及在海量數(shù)據(jù)中的查找算法:布隆過(guò)濾器和倒排索引查找,介紹了資源分配算法,包括常用的銀行家算法和背包問(wèn)題的解決算法。
第3章 路徑分析算法
主要介紹了路徑分析算法,包括基于Dijkstra算法、Floyd算法、A*算法的路徑分析方法。除了介紹傳統(tǒng)的路徑分析算法外,還介紹了維特比算法在概率中的路徑選擇,以及最長(zhǎng)公共子串、最長(zhǎng)公共子序列問(wèn)題的求解算法。整個(gè)內(nèi)容涵蓋了絕大部分的路徑選擇算法。
第4章 相似度分析算法
主要介紹了相似內(nèi)容的分析理論和應(yīng)用,從簡(jiǎn)單的Jaccard相似系數(shù)開(kāi)始入手,逐步深入到基于MinHash的相似性算法以及向量空間模型,向量空間模型已經(jīng)成為眾多算法的基礎(chǔ)理論。后續(xù)還深入介紹了基于余弦相似性算法和基于語(yǔ)義主題模型的語(yǔ)義相似度算法,以及基于SimHash的指紋碼重復(fù)值驗(yàn)證算法。
第5章 數(shù)據(jù)分類算法
集中介紹了數(shù)據(jù)分類算法的解決方案,從簡(jiǎn)單易于理解的樸素貝葉斯模型開(kāi)始,由淺入深地介紹了AdaBoost分類器及支持向量機(jī),它們都是數(shù)據(jù)分類的有效解決方案,還對(duì)機(jī)器學(xué)習(xí)的相關(guān)基礎(chǔ)知識(shí)做了概要介紹,最后介紹了K鄰近算法在數(shù)據(jù)分類中的應(yīng)用。
第6章 數(shù)據(jù)聚類算法
介紹了數(shù)據(jù)聚類的相關(guān)算法,其中,無(wú)監(jiān)督的聚類算法目前是比較熱門(mén)的研究領(lǐng)域。首先介紹了傳統(tǒng)的基于系統(tǒng)聚類的方法;然后介紹了基于K-Means聚類算法及基于密度的DBSCAN算法;最后介紹了基于BIRCH算法的聚類分析,通過(guò)聚類特征及聚類特征實(shí)現(xiàn)數(shù)據(jù)聚類。
第7章 數(shù)據(jù)預(yù)測(cè)與估算算法
介紹了數(shù)據(jù)的預(yù)測(cè)和估算的算法體系和應(yīng)用范例,從產(chǎn)生式模型和判別式模型入手介紹各類模型的方法論。首先介紹了基于最大似然估計(jì)的預(yù)測(cè)以及基于線性回歸的估算、基于最大期望算法;然后介紹了基于隱馬爾科夫模型模型預(yù)測(cè);最后介紹了基于條件隨機(jī)場(chǎng)的序列預(yù)測(cè)。
第8章 數(shù)據(jù)決策分析算法
對(duì)數(shù)據(jù)決策的分析方法做了詳細(xì)介紹,主要圍繞決策樹(shù)的理論基礎(chǔ)展開(kāi)。首先介紹了基于ID3算法的決策分析,包括信息熵、信息增益等;然后介紹了基于C4.5算法的分類決策樹(shù)及基于分類回歸樹(shù)的決策劃分;最后介紹了基于隨機(jī)森林的決策分類。介紹過(guò)程中包含了大量實(shí)例。
第9章 數(shù)據(jù)關(guān)聯(lián)規(guī)則分析算法
主要介紹了關(guān)聯(lián)規(guī)則分析方法的理論和實(shí)踐。Apriori算法作為最常用的關(guān)聯(lián)規(guī)則分析算法已經(jīng)被廣泛應(yīng)用到各個(gè)領(lǐng)域,本章也對(duì)Apriori算法進(jìn)行了深入的介紹,并對(duì)和Apriori算法同等重要的FP-Growth算法也通過(guò)實(shí)例做了詳細(xì)介紹。本章最后還介紹了利用倒排文件思想的Eclat算法。
第10章 數(shù)據(jù)與推薦算法
主要介紹了數(shù)據(jù)與推薦算法中的應(yīng)用關(guān)系,推薦算法作為目前各行各業(yè)最熱門(mén)的算法之一,已經(jīng)應(yīng)用非常廣泛。本章介紹了基于物品本身屬性關(guān)系的Item-Based協(xié)同過(guò)濾推薦算法,以及基于User-Based協(xié)同過(guò)濾推薦算法。除此之外,還介紹了基于流行度和潛在因子的推薦算法,以及推薦算法的效果評(píng)估相關(guān)內(nèi)容。
適讀人群:
對(duì)基本算法和機(jī)器學(xué)習(xí)算法有興趣的讀者;
對(duì)數(shù)據(jù)分析和統(tǒng)計(jì)學(xué)有興趣的讀者;
對(duì)算法有研究的基礎(chǔ)算法、機(jī)器學(xué)習(xí)工程師;
互聯(lián)網(wǎng)行業(yè)的不同層次從業(yè)者;
軟件或計(jì)算機(jī)專業(yè)的在校大學(xué)生。
推薦閱讀:
【每周一本書(shū)】之《圖說(shuō)D3:數(shù)據(jù)可視化利器從入門(mén)到進(jìn)階》
【每周一本書(shū)】之《Hadoop金融大數(shù)據(jù)分析》:利用大數(shù)據(jù)為金融機(jī)構(gòu)提供超強(qiáng)洞察力、分析與BI思想!
【每周一本書(shū)】之《Python大戰(zhàn)機(jī)器學(xué)習(xí):數(shù)據(jù)科學(xué)家的第一個(gè)小目標(biāo)》
【每周一本書(shū)】之《圖解Spark:核心技術(shù)與案例實(shí)戰(zhàn)》
【每周一本書(shū)】之《大數(shù)據(jù)技術(shù)概論》:菜鳥(niǎo)學(xué)大數(shù)據(jù),如果這些還不會(huì),勸你一定要補(bǔ)上!
【每周一本書(shū)】之《數(shù)據(jù)新聞實(shí)戰(zhàn)》:趁早學(xué)!這些工具,新聞人將越來(lái)越離不開(kāi)
點(diǎn)擊查看更多大數(shù)據(jù)書(shū)籍……
本書(shū)由 數(shù)據(jù)猿聯(lián)合電子工業(yè)出版社 共同推薦
【本欄目合作伙伴】:清華大學(xué)出版社、電子工業(yè)出版社、北京師范大學(xué)出版社、中國(guó)人民大學(xué)出版社。
歡迎更多合作伙伴加入!也歡迎勾搭小編,微信:wmh4178,備注“書(shū)”
來(lái)源:數(shù)據(jù)猿
刷新相關(guān)文章
我要評(píng)論
活動(dòng)推薦more >
- 2018 上海國(guó)際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國(guó)際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國(guó)國(guó)際信息通信展覽會(huì)將于2018-09-26
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)62018-06-21
- 第五屆FEA消費(fèi)金融國(guó)際峰會(huì)2018-06-21
- “無(wú)界區(qū)塊鏈技術(shù)峰會(huì)2018”2018-06-14
不容錯(cuò)過(guò)的資訊
-
1#后疫情時(shí)代的新思考#疫情之下,關(guān)于醫(yī)
-
2數(shù)據(jù)軟件產(chǎn)品和服務(wù)商DataHunter完成B輪
-
3眾盟科技獲ADMIC 2020金粲獎(jiǎng)“年度汽車
-
4數(shù)據(jù)智能 無(wú)限未來(lái)—2020世界人工智能大
-
5#2020非凡大賞:數(shù)字化風(fēng)起云涌時(shí),共尋
-
6#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險(xiǎn)感知
-
7#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
8#榜樣的力量#實(shí)時(shí)新型肺炎疫情數(shù)據(jù)小程
-
9#榜樣的力量#華佗疫情防控平臺(tái)丨數(shù)據(jù)猿
-
10#后疫情時(shí)代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新