什么是分布式數(shù)據(jù)庫?
數(shù)據(jù)猿 | 2015-11-09 18:05
【數(shù)據(jù)猿導(dǎo)讀】 近年來,隨著數(shù)據(jù)量的高速增長,分布式數(shù)據(jù)庫技術(shù)也得到了快速的發(fā)展,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫開始從集中式模型向分布式架構(gòu)發(fā)展

分布式數(shù)據(jù)庫是指利用高速計算機(jī)網(wǎng)絡(luò)將物理上分散的多個數(shù)據(jù)存儲單元連接起來組成一個邏輯上統(tǒng)一的數(shù)據(jù)庫。分布式數(shù)據(jù)庫的基本思想是將原來集中式數(shù)據(jù)庫中的數(shù)據(jù)分散存儲到多個通過網(wǎng)絡(luò)連接的數(shù)據(jù)存儲節(jié)點上,以獲取更大的存儲容量和更高的并發(fā)訪問量。近年來,隨著數(shù)據(jù)量的高速增長,分布式數(shù)據(jù)庫技術(shù)也得到了快速的發(fā)展,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫開始從集中式模型向分布式架構(gòu)發(fā)展,基于關(guān)系型的分布式數(shù)據(jù)庫在保留了傳統(tǒng)數(shù)據(jù)庫的數(shù)據(jù)模型和基本特征下,從集中式存儲走向分布式存儲,從集中式計算走向分布式計算。
另一方面,隨著數(shù)據(jù)量越來越大,關(guān)系型數(shù)據(jù)庫開始暴露出一些難以克服的缺點,以NoSQL 為代表的非關(guān)系型數(shù)據(jù)庫,其高可擴(kuò)展性、高并發(fā)性等優(yōu)勢出現(xiàn)了快速發(fā)展,一時間市場上出現(xiàn)了大量的key-value 存儲系統(tǒng)、文檔型數(shù)據(jù)庫等NoSQL 數(shù)據(jù)庫產(chǎn)品。NoSQL 類型數(shù)據(jù)庫正日漸成為大數(shù)據(jù)時代下分布式數(shù)據(jù)庫領(lǐng)域的主力。
這種組織數(shù)據(jù)庫的方法克服了物理中心數(shù)據(jù)庫組織的弱點。
首先,降低了數(shù)據(jù)傳送代價,因為大多數(shù)的對數(shù)據(jù)庫的訪問操作都是針對局部數(shù)據(jù)庫的,而不是對其他位置的數(shù)據(jù)庫訪問;
其次,系統(tǒng)的可靠性提高了很多,因為當(dāng)網(wǎng)絡(luò)出現(xiàn)故障時,仍然允許對局部數(shù)據(jù)庫的操作,而且一個位置的故障不影響其他位置的處理工作,只有當(dāng)訪問出現(xiàn)故障位置的數(shù)據(jù)時,在某種程度上才受影響;
第三,便于系統(tǒng)的擴(kuò)充,增加一個新的局部數(shù)據(jù)庫,或在某個位置擴(kuò)充一臺適當(dāng)?shù)男⌒陀嬎銠C(jī),都很容易實現(xiàn)。然而有些功能要付出更高的代價。例如,為了調(diào)配在幾個位置上的活動,事務(wù)管理的性能比在中心數(shù)據(jù)庫時花費更高,而且甚至抵消許多其他的優(yōu)點。
分布式軟件系統(tǒng)(Distributed Software Systems)是支持分布式處理的軟件系統(tǒng),是在由通信網(wǎng)絡(luò)互聯(lián)的多處理機(jī)體系結(jié)構(gòu)上執(zhí)行任務(wù)的系統(tǒng)。它包括分布式操作系統(tǒng)、分布式程序設(shè)計語言及其編譯(解釋)系統(tǒng)、分布式文件系統(tǒng)和分布式數(shù)據(jù)庫系統(tǒng)等。
分布式操作系統(tǒng)負(fù)責(zé)管理分布式處理系統(tǒng)資源和控制分布式程序運行。它和集中式操作系統(tǒng)的區(qū)別在于資源管理、進(jìn)程通信和系統(tǒng)結(jié)構(gòu)等方面。 分布式程序設(shè)計語言用于編寫運行于分布式計算機(jī)系統(tǒng)上的分布式程序。一個分布式程序由若干個可以獨立執(zhí)行的程序模塊組成,它們分布于一個分布式處理系統(tǒng)的多臺計算機(jī)上被同時執(zhí)行。它與集中式的程序設(shè)計語言相比有三個特點:分布性、通信性和穩(wěn)健性。 分布式文件系統(tǒng)具有執(zhí)行遠(yuǎn)程文件存取的能力,并以透明方式對分布在網(wǎng)絡(luò)上的文件進(jìn)行管理和存取。 分布式數(shù)據(jù)庫系統(tǒng)由分布于多個計算機(jī)結(jié)點上的若干個數(shù)據(jù)庫系統(tǒng)組成,它提供有效的存取手段來操縱這些結(jié)點上的子數(shù)據(jù)庫。分布式數(shù)據(jù)庫在使用上可視為一個完整的數(shù)據(jù)庫,而實際上它是分布在地理分散的各個結(jié)點上。當(dāng)然,分布在各個結(jié)點上的子數(shù)據(jù)庫在邏輯上是相關(guān)的。
Hadoop的分布式文件系統(tǒng)HDFS,作為開源的分布式平臺,為目前流行的很多分布式數(shù)據(jù)庫提供了支持,譬如HBase等。Yonghong的分布式文件系統(tǒng)ZFS,為分布式數(shù)據(jù)集市Z-DataMart提供了底層平臺。
主要特點
大數(shù)據(jù)時代,面對海量數(shù)據(jù)量的井噴式增長和不斷增長的用戶需求,分布式數(shù)據(jù)庫必須具有如下特征,才能應(yīng)對不斷增長的海量數(shù)據(jù)。
● 高可擴(kuò)展性:分布式數(shù)據(jù)庫必須具有高可擴(kuò)展性,能夠動態(tài)地增添存儲節(jié)點以實現(xiàn)存儲容量的線性擴(kuò)展。
● 高并發(fā)性:分布式數(shù)據(jù)庫必須及時響應(yīng)大規(guī)模用戶的讀/寫請求,能對海量數(shù)據(jù)進(jìn)行隨機(jī)讀/寫。
● 高可用性:分布式數(shù)據(jù)庫必須提供容錯機(jī)制,能夠?qū)崿F(xiàn)對數(shù)據(jù)的冗余備份,保證數(shù)據(jù)和服務(wù)的高度可靠性。
分布式數(shù)據(jù)庫相對傳統(tǒng)集中式數(shù)據(jù)庫的優(yōu)點
大數(shù)據(jù)時代,面對日益增長的海量數(shù)據(jù),傳統(tǒng)的集中式數(shù)據(jù)庫的弊端日益顯現(xiàn),分布式數(shù)據(jù)庫相對傳統(tǒng)的集中式數(shù)據(jù)庫有如下優(yōu)點。
● 更高的數(shù)據(jù)訪問速度:分布式數(shù)據(jù)庫為了保證數(shù)據(jù)的高可靠性,往往采用備份的策略實現(xiàn)容錯,所以,在讀取數(shù)據(jù)的時候,客戶端可以并發(fā)地從多個備份服務(wù)器同時讀取,從而提高了數(shù)據(jù)訪問速度。
● 更強(qiáng)的可擴(kuò)展性:分布式數(shù)據(jù)庫可以通過增添存儲節(jié)點來實現(xiàn)存儲容量的線性擴(kuò)展,而集中式數(shù)據(jù)庫的可擴(kuò)展性十分有限。
● 更高的并發(fā)訪問量:分布式數(shù)據(jù)庫由于采用多臺主機(jī)組成存儲集群,所以相對集中式數(shù)據(jù)庫,它可以提供更高的用戶并發(fā)訪問量。
來源:原創(chuàng)
刷新相關(guān)文章
我要評論
活動推薦more >
- 【確認(rèn)出席】馬世韜 北電數(shù)2024-07-18
- 【確認(rèn)出席】仲光慶 楓清科2024-07-18
- 【確認(rèn)出席】孟慶歡 鏡舟科2024-07-18
- 【確認(rèn)出席】陳敏儀 聯(lián)想集2024-07-18
- CFS第十二屆財經(jīng)峰會定于7月2023-02-22
- 蟬大師發(fā)布抖音2022電商年度2023-02-21