一 分布式數(shù)據(jù)庫(kù)系統(tǒng)概述
分布式數(shù)據(jù)庫(kù)系統(tǒng)是在集中式數(shù)據(jù)庫(kù)系統(tǒng)的基礎(chǔ)上發(fā)展起來(lái)的,是計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)結(jié)合的產(chǎn)物。分布式數(shù)據(jù)庫(kù)系統(tǒng)適合于單位分散的部門(mén),允許各個(gè)部門(mén)將其常用的數(shù)據(jù)存儲(chǔ)在本地,實(shí)施就地存放本地使用,從而提高響應(yīng)速度,降低通信費(fèi)用。基于網(wǎng)絡(luò)基礎(chǔ)上的分布式數(shù)據(jù)庫(kù)系統(tǒng)經(jīng)常對(duì)數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)分片。從數(shù)據(jù)意義上講,數(shù)據(jù)分布的合理與否不僅影響著訪(fǎng)問(wèn)的局部性,而且也制約著數(shù)據(jù)查詢(xún)及事務(wù)處理的效率。
在分布式數(shù)據(jù)庫(kù)中,數(shù)據(jù)存儲(chǔ)包括數(shù)據(jù)分片和數(shù)據(jù)分配兩個(gè)部分。數(shù)據(jù)分片和分布是分布式數(shù)據(jù)庫(kù)中兩個(gè)重要慨念,分布式數(shù)據(jù)庫(kù)大部分問(wèn)題均與數(shù)據(jù)分片和分布有關(guān),它們對(duì)整個(gè)系統(tǒng)的可用性、可靠性、及效率都有極大的影響,同時(shí)也與分布式數(shù)據(jù)庫(kù)系統(tǒng)的其他方面密切相關(guān),尤其是分布式查詢(xún)處理問(wèn)題。以關(guān)系數(shù)據(jù)庫(kù)為例,在關(guān)系型分布式數(shù)據(jù)庫(kù)系統(tǒng)(RDDB)中,數(shù)據(jù)分片是從邏輯上將全局關(guān)系劃分為邏輯片斷即子關(guān)系,而數(shù)據(jù)分配就是再以一定的冗余度將子關(guān)系分配到多個(gè)結(jié)點(diǎn)上,數(shù)據(jù)存儲(chǔ)即數(shù)據(jù)分片與數(shù)據(jù)分配的總和。數(shù)據(jù)分片是一種對(duì)關(guān)系的劃分,在集中式數(shù)據(jù)庫(kù)中可以將所有的表視為一個(gè)總?cè)直淼倪壿嬜颖恚側(cè)直硎沁@些子表的并集,其屬性包括這些子表的所有屬性,元組包括這些子表的所有元組,對(duì)應(yīng)的在這個(gè)總?cè)直砩显M的非空值呈塊狀區(qū)域分布。數(shù)據(jù)分配則是將這些子表以不同的冗余度存放在一個(gè)或多個(gè)場(chǎng)地或節(jié)點(diǎn),這兩者間的區(qū)別在于集中式數(shù)據(jù)庫(kù)不存在數(shù)據(jù)復(fù)制的問(wèn)題,不需要存在多副本,但也會(huì)出現(xiàn)表名不同。但表屬性和屬性值完全相同。
二 分布式數(shù)據(jù)庫(kù)的設(shè)計(jì)
如何在不同的計(jì)算機(jī)上分布文獻(xiàn)資料的數(shù)據(jù)和程序才能提高系統(tǒng)效率,增加系統(tǒng)的可靠性和可用性。這是我們面臨的重要問(wèn)題。為了增加系統(tǒng)的可靠性。系統(tǒng)就必須使數(shù)據(jù)重復(fù),也就是系統(tǒng)應(yīng)保持幾個(gè)相同的副本,每個(gè)副本放在不同的結(jié)點(diǎn)內(nèi)形成數(shù)據(jù)重復(fù),數(shù)據(jù)重復(fù)不但可以增加系統(tǒng)的堅(jiān)定性,還可以提高系統(tǒng)的并行性。借助于多個(gè)副本,幾個(gè)結(jié)點(diǎn)可以并行地處理有關(guān)查詢(xún)。然而,系統(tǒng)存在著多副本就必須要保證全部副本的一致性結(jié)果會(huì)增加系統(tǒng)的總開(kāi)銷(xiāo)。因此,我們必須認(rèn)真考慮文獻(xiàn)資料數(shù)據(jù)資源共享的合理分布。
而在分布式數(shù)據(jù)庫(kù)中,由于數(shù)據(jù)的分布和冗余,使得查詢(xún)處理中需要考慮站點(diǎn)間傳輸數(shù)據(jù)的通信費(fèi)用,所以除了考慮CPU代價(jià)和I\O代價(jià)之外。還應(yīng)該包括數(shù)據(jù)在網(wǎng)絡(luò)上的傳輸代價(jià)。即總代價(jià)=CPU代價(jià)+I\O代價(jià)+通信代價(jià)。因此,分布式數(shù)據(jù)庫(kù)進(jìn)行分布式設(shè)計(jì)時(shí),一個(gè)重要原則是使數(shù)據(jù)和應(yīng)用程序?qū)崿F(xiàn)最大程度的本地性,這樣就可以使應(yīng)用數(shù)據(jù)盡可能地本地化,以減少通信開(kāi)支。對(duì)于建立在各場(chǎng)所的分布式數(shù)據(jù)庫(kù),不需要過(guò)分進(jìn)行限制,但也必須要有規(guī)范的設(shè)計(jì)要求。
(1)硬件規(guī)范,必須支持局域網(wǎng)乃至Internet的包括聲音,文字,圖像的交流,支持IE或Netscape瀏覽web界面,支持開(kāi)放性數(shù)據(jù)源的建立。
(2)數(shù)據(jù)庫(kù)形式規(guī)范,原則上Access、Paradox,甚至文本文件都可以進(jìn)行數(shù)據(jù)傳輸,但必須保證自己有開(kāi)放式數(shù)據(jù)源的特征及關(guān)系繼承的特征。
(3)域的統(tǒng)一和分類(lèi)、分科的統(tǒng)一,數(shù)據(jù)庫(kù)在各個(gè)分布場(chǎng)所必須有統(tǒng)一的域結(jié)構(gòu),以確保給用戶(hù)提供完整統(tǒng)一的視圖,科目分類(lèi)的命名必須要求規(guī)范,以確保查詢(xún)和統(tǒng)計(jì)工作的準(zhǔn)確性,在方便工作的條件下,可以不要求唯一確定的主關(guān)鍵字。
三 傳統(tǒng)數(shù)據(jù)庫(kù)存在的問(wèn)題
隨著計(jì)算機(jī)技術(shù)的發(fā)展和應(yīng)用的深入,分布式技術(shù)在構(gòu)建企業(yè)級(jí)應(yīng)用程序中更為廣泛流行。是因?yàn)榉植际綌?shù)據(jù)庫(kù)存儲(chǔ)方式給企業(yè)帶來(lái)了很多的方便以及好處。在沒(méi)興起分布式浪潮之前,由于傳統(tǒng)的數(shù)據(jù)存儲(chǔ)方式過(guò)于簡(jiǎn)單化,過(guò)于集中管理而造成了大量數(shù)據(jù)的堆積。這樣一來(lái)一個(gè)公司或企業(yè)要使用大量的數(shù)據(jù)就需要大量的存儲(chǔ)數(shù)據(jù)的介質(zhì),而導(dǎo)致服務(wù)器的回應(yīng)下降乃至崩潰,這樣一來(lái)就會(huì)有大量數(shù)據(jù)會(huì)隨著服務(wù)器的崩潰而丟失,而數(shù)據(jù)對(duì)于大型企業(yè)來(lái)說(shuō)數(shù)據(jù)量會(huì)很大,數(shù)據(jù)的丟失,沒(méi)有了數(shù)據(jù)的對(duì)照會(huì)使企業(yè)的業(yè)績(jī)虧損,更嚴(yán)重的說(shuō)也可能導(dǎo)致企業(yè)倒閉。這種方式存儲(chǔ)還不能解決的問(wèn)題就是異地的存儲(chǔ),有的企業(yè)會(huì)有很多的分公司,這樣一來(lái)就傳統(tǒng)的數(shù)據(jù)存儲(chǔ)就會(huì)帶來(lái)大量人力、資金的浪費(fèi)。這些問(wèn)題的存在也促進(jìn)了分布式數(shù)據(jù)庫(kù)的發(fā)展。
四 剖析分布式數(shù)據(jù)庫(kù)存儲(chǔ)的優(yōu)勢(shì)
分布式數(shù)據(jù)庫(kù)顧名思義,具有分布數(shù)據(jù)的功能,實(shí)際上它的數(shù)據(jù)存儲(chǔ)方式是物理上是分布的,邏輯上是集中的。也就是說(shuō)分布式數(shù)據(jù)就是指數(shù)據(jù)和程序可以不位于一個(gè)服務(wù)器上,而是分散到多個(gè)服務(wù)器,以網(wǎng)絡(luò)上分散分布的地理信息數(shù)據(jù)及受其影響的數(shù)據(jù)庫(kù)操作為研究對(duì)象的一種理論計(jì)算模型。而分布式數(shù)據(jù)庫(kù)數(shù)據(jù)存儲(chǔ)是在不同地域或者不同網(wǎng)絡(luò)之間的存儲(chǔ),進(jìn)而達(dá)到數(shù)據(jù)共享,數(shù)據(jù)交換的目的。分布式數(shù)據(jù)存儲(chǔ)是先經(jīng)過(guò)一個(gè)“鈍化”,然后“序列化”成文件從內(nèi)存中的一端傳到網(wǎng)絡(luò)的另一端,到另一端后在激活的一系列過(guò)程,詳細(xì)的說(shuō)數(shù)據(jù)流在加工過(guò)程中產(chǎn)生的臨時(shí)文件或加工過(guò)程中需要查找的信息。數(shù)據(jù)以某種格式記錄在計(jì)算機(jī)內(nèi)部或外部存儲(chǔ)介質(zhì)上。數(shù)據(jù)存儲(chǔ)要命名,這種命名要反映信息特征的組成含義。數(shù)據(jù)流反映了系統(tǒng)中流動(dòng)的數(shù)據(jù),表現(xiàn)出動(dòng)態(tài)數(shù)據(jù)的特征;數(shù)據(jù)存儲(chǔ)反映系統(tǒng)中靜止的數(shù)據(jù),表現(xiàn)出靜態(tài)數(shù)據(jù)的特征。這就是它的存儲(chǔ)過(guò)程。
五 總結(jié)分布式數(shù)據(jù)庫(kù)存儲(chǔ)的優(yōu)勢(shì)
分布式數(shù)據(jù)的優(yōu)勢(shì)也正體現(xiàn)在這“分布”這兩個(gè)字,讓操作終端的人感覺(jué)不到數(shù)據(jù)庫(kù)的分散,當(dāng)然這也需要好的網(wǎng)絡(luò)的努持。使使用者感覺(jué)是在本地?cái)?shù)據(jù)庫(kù)操作一樣。這樣既方便又快捷,使維護(hù)起來(lái)不用操作大量的數(shù)據(jù)。它綜合了計(jì)算機(jī)(Computer)、通訊(Communication)、顯示(CRT)和控制(Control)等4項(xiàng)技術(shù),其基本思想是分散控制,集中操作、分級(jí)管理、配置靈活、高可靠性,易于維護(hù)等基本特點(diǎn),從而實(shí)現(xiàn)了異地存儲(chǔ)的實(shí)現(xiàn)。
六 結(jié)語(yǔ)
通過(guò)分布式數(shù)據(jù)庫(kù)的學(xué)習(xí),對(duì)分布式數(shù)據(jù)庫(kù)有了初步的了解和掌握,學(xué)到了分布式存儲(chǔ)、交換、事務(wù)處理、網(wǎng)絡(luò)存儲(chǔ)等機(jī)制和方法。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴(lài)品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/
本文標(biāo)題:淺談分布式數(shù)據(jù)庫(kù)的數(shù)據(jù)存儲(chǔ)
本文網(wǎng)址:http://www.guhuozai8.cn/html/support/1112154858.html