1、引言
隨著計算機網(wǎng)絡(luò)的發(fā)展,原來的集中式信息系統(tǒng)逐漸轉(zhuǎn)變成了分布式的網(wǎng)絡(luò)信息應(yīng)用系統(tǒng)。同時人類社會對分布式網(wǎng)絡(luò)系統(tǒng)的依賴程度、可靠性要求也越來越高。特別是稱之為關(guān)鍵信息系統(tǒng)的,如金融、電信這樣的行業(yè),其企業(yè)信息系統(tǒng)往往承載了企業(yè)的整個運作過程,因此就對業(yè)務(wù)系統(tǒng)的可靠性、數(shù)據(jù)的完整性以及業(yè)務(wù)的連續(xù)性要求很高。據(jù)有關(guān)報告顯示:只有6%的公司在數(shù)據(jù)丟失后生存下來,43%的公司再也無法重新開業(yè),超過50%的公司會在兩到三年后消失。為了保證企業(yè)關(guān)鍵數(shù)據(jù)的完全性和完整性,建立一套完備的容災(zāi)系統(tǒng)是企業(yè)關(guān)鍵數(shù)據(jù)的最可靠保證。本文針對數(shù)據(jù)容災(zāi)理論及相關(guān)的技術(shù)進(jìn)行分析和研究。
2、容災(zāi)的理論
2.1容災(zāi)的概念
容災(zāi)(disaster tolerance)是一個范疇廣泛的概念,從廣義上,任何提高系統(tǒng)可靠性與可用性的努力都可稱為容災(zāi)。從狹義上,容災(zāi)是通過在異地建立和維護(hù)一個備份存儲系統(tǒng),利用地理上的分離來保證系統(tǒng)和數(shù)據(jù)對災(zāi)難性事件的抵御能力。當(dāng)災(zāi)難發(fā)生時,如何能夠在最短的時間內(nèi)使系統(tǒng)恢復(fù)正常,保證數(shù)據(jù)最少丟失,都是容災(zāi)技術(shù)研究的內(nèi)容。
2.2容災(zāi)的分類
因為災(zāi)難所包含的內(nèi)容較廣,容災(zāi)所涉及的內(nèi)容也較多,所以可以從多個角度對容災(zāi)進(jìn)行分類。從距離角度分為木地容災(zāi),近距離容災(zāi),遠(yuǎn)距離容災(zāi)。這三種類型所能容忍的災(zāi)難也是不相同的,這與備用系統(tǒng)和生產(chǎn)系統(tǒng)的距離是密切相關(guān)的。
從應(yīng)用角度,容災(zāi)系統(tǒng)的實現(xiàn)可分為兩個層次:數(shù)據(jù)容災(zāi)和應(yīng)用容災(zāi)。數(shù)據(jù)容災(zāi)指建立一個異地的備份數(shù)據(jù)系統(tǒng),備份本地關(guān)鍵應(yīng)用數(shù)據(jù),即數(shù)據(jù)的異地備份。應(yīng)用容災(zāi)是在數(shù)據(jù)容災(zāi)的基礎(chǔ)上,在異地建立一套完整的與本地生產(chǎn)系統(tǒng)相當(dāng)?shù)膫浞輵?yīng)用系統(tǒng)(可以互為備份,可以共同工作)。在災(zāi)難出現(xiàn)后,遠(yuǎn)程備份系統(tǒng)迅速接管業(yè)務(wù)運行。數(shù)據(jù)容災(zāi)是應(yīng)用容災(zāi)的基礎(chǔ),應(yīng)用容災(zāi)是更高層次的容災(zāi)系統(tǒng)。
2.3容災(zāi)系統(tǒng)的評價指標(biāo)
容災(zāi)系統(tǒng)需要考慮多方面的因素,如備份和恢復(fù)數(shù)據(jù)量大小、災(zāi)難發(fā)生時數(shù)據(jù)的丟失量、應(yīng)用數(shù)據(jù)中心和備援?dāng)?shù)據(jù)中心之間的地理距離和數(shù)據(jù)傳輸方式、災(zāi)難發(fā)生時所要求的恢復(fù)速度和恢復(fù)層次、備援中心的管理及投人資金等。根據(jù)這些因素和不同的應(yīng)用場合,容災(zāi)備份中心自動異地遠(yuǎn)程恢復(fù)被定義有7層,其中包含了2個技術(shù)指標(biāo)。
一般是以數(shù)據(jù)丟失量和數(shù)據(jù)恢復(fù)時間作為標(biāo)準(zhǔn)進(jìn)行評價的,所公認(rèn)的評價標(biāo)準(zhǔn)是RTO和RPO。
①RPO(Recovery Point Objective):即數(shù)據(jù)恢復(fù)點目標(biāo),主要指的是業(yè)務(wù)系統(tǒng)所能容忍的數(shù)據(jù)丟失量;
② RTO(Re-coverty Time Objective):即恢復(fù)時間目標(biāo),主要指的是所能容忍的業(yè)務(wù)停止服務(wù)的最長時間,也就是從災(zāi)難發(fā)生到業(yè)務(wù)系統(tǒng)恢復(fù)服務(wù)功能所需要的最短時間周期。RPO針對的是數(shù)據(jù)丟失,而RTO針對的是服務(wù)丟失,二者沒有必然的關(guān)聯(lián)性。
RTO和RPO的確定必須在進(jìn)行風(fēng)險分析和業(yè)務(wù)影響分析后根據(jù)不同的業(yè)務(wù)需求確定。對于不同企業(yè)的同一種業(yè)務(wù),RTO和RPO的需求也會有所不同。
3、關(guān)鍵技術(shù)的分析
用于容災(zāi)系統(tǒng)的關(guān)鍵技術(shù)主要包含:數(shù)據(jù)存儲管理、數(shù)據(jù)復(fù)制、災(zāi)難檢測、系統(tǒng)遷移和系統(tǒng)恢復(fù)五個方面。在這里只介紹最重要的兩個方面。
3.1數(shù)據(jù)存儲管理
數(shù)據(jù)存儲管理,是指對與計算機系統(tǒng)數(shù)據(jù)存儲相關(guān)的一系列操作(如備份,歸檔,恢復(fù)等)進(jìn)行的統(tǒng)一管理,是建立一個容災(zāi)系統(tǒng)的重要組成部分。數(shù)據(jù)存儲管理工作包括數(shù)據(jù)備份、數(shù)據(jù)恢復(fù)、備份索引、備份設(shè)備及媒體和災(zāi)難恢復(fù)等與數(shù)據(jù)備份相關(guān)的所有管理。
(1)數(shù)據(jù)備份,是指為防止系統(tǒng)出現(xiàn)操作失誤或系統(tǒng)故障導(dǎo)致數(shù)據(jù)丟失,而將全系統(tǒng)或部分?jǐn)?shù)據(jù)集合從應(yīng)用主機的硬盤或陣列復(fù)制到其它的存儲介質(zhì)的過程,數(shù)據(jù)備份是容災(zāi)的基石。
(2)數(shù)據(jù)歸檔,是將硬盤數(shù)據(jù)復(fù)制到可移動媒體上。與數(shù)據(jù)備份不同的是,數(shù)據(jù)歸檔在完成復(fù)制工作后將原始數(shù)據(jù)從硬盤上刪除,釋放硬盤空間。
數(shù)據(jù)備份,是數(shù)據(jù)存儲管理中的一個重要部分。數(shù)據(jù)備份的評價標(biāo)準(zhǔn)包括備份速度、恢復(fù)速度以及數(shù)據(jù)恢復(fù)點。提高數(shù)據(jù)備份管理的透明性和自動化,管理好各種存儲設(shè)備,也是需要解決的一個重要問題,而存儲虛擬化技術(shù)通過將各種異構(gòu)的存儲系統(tǒng)整合成為能夠作為單一資源易于管理的單一存儲池解決這個問題。
3.2數(shù)據(jù)復(fù)制
數(shù)據(jù)復(fù)制是容災(zāi)系統(tǒng)的核心技術(shù),是將一個地點的數(shù)據(jù)拷貝到另外一個不同的物理點上的過程。數(shù)據(jù)復(fù)制一般分為同步數(shù)據(jù)復(fù)制和異步數(shù)據(jù)復(fù)制。同步數(shù)據(jù)復(fù)制是通過將本地生產(chǎn)數(shù)據(jù)以完全同步的方式復(fù)制到異地,每一本地IO交易均需等待遠(yuǎn)程復(fù)制的完成方予以釋放,其特點是基本可以做到零數(shù)據(jù)丟失;異步數(shù)據(jù)復(fù)制指將本地生產(chǎn)數(shù)據(jù)以后臺同步的方式復(fù)制到異地,每一本地IO交易均正常釋放,無需等待遠(yuǎn)程復(fù)制的完成。其特點是在災(zāi)難發(fā)生時,會有少量數(shù)據(jù)丟失,與網(wǎng)絡(luò)帶寬、網(wǎng)絡(luò)延遲、I/O吞吐量相關(guān)。
實現(xiàn)數(shù)據(jù)的異地復(fù)制,有軟件方式和硬件方式兩種途徑。軟件方式,是通過主機端軟件來實現(xiàn)。即在主系統(tǒng)和容災(zāi)系統(tǒng)的主機上,安裝專用的數(shù)據(jù)復(fù)制軟件。其優(yōu)點是與硬件無關(guān),成本較低。缺點是效率較低和可管理性較差。硬件方式,是數(shù)據(jù)直接在存儲設(shè)備之間傳輸,并不依賴主機的管理。這種方式要求在主系統(tǒng)和容災(zāi)系統(tǒng)配置上支持這種功能的專用存儲設(shè)備,所以成本較高。根據(jù)復(fù)制數(shù)據(jù)的層次可以分為四種類型:
①硬件級的數(shù)據(jù)復(fù)制;
②操作系統(tǒng)級的復(fù)制;
③數(shù)據(jù)庫級的復(fù)制;
④業(yè)務(wù)數(shù)據(jù)流級復(fù)制。
容災(zāi)數(shù)據(jù)復(fù)制的性能和網(wǎng)絡(luò)帶寬、復(fù)制距離、數(shù)據(jù)傳輸方式、數(shù)據(jù)塊打包方式、系統(tǒng)處理能力有關(guān)。可以看出,其中通訊問題是影響遠(yuǎn)程復(fù)制效率的最關(guān)鍵因素。
4、容災(zāi)系統(tǒng)的實現(xiàn)方式
4.1基于主機的容災(zāi)
通過在主機上安裝軟件實現(xiàn)數(shù)據(jù)在服務(wù)器之間的復(fù)制。這種方式對存儲系統(tǒng)沒有限制,支持異構(gòu)存儲系統(tǒng),不需要增加硬件,同時可以在服務(wù)器層增加應(yīng)用遠(yuǎn)程切換功能軟件,從而構(gòu)成完整的應(yīng)用級災(zāi)備方案。但這種方式對軟件要求高,生產(chǎn)中心和災(zāi)備中心的每一臺應(yīng)用服務(wù)器上都需要安裝專門的軟件,隨著服務(wù)器數(shù)目的增加,成本也線性增加。同時存儲目標(biāo)數(shù)據(jù)的邏輯卷不能被業(yè)務(wù)系統(tǒng)直接使用。由于需要在服務(wù)器上運行軟件,對服務(wù)器兼容性和性能也會有所影響。
4.2基于存儲設(shè)備的容災(zāi)
通過存儲控制器實現(xiàn)的設(shè)備級數(shù)據(jù)遠(yuǎn)程鏡像或復(fù)制,是傳統(tǒng)災(zāi)備中最高效最可靠的方式。基于存儲設(shè)備的容災(zāi)與服務(wù)器平臺無關(guān),遠(yuǎn)程復(fù)制由生產(chǎn)中心和災(zāi)備中心的存儲系統(tǒng)完成,對應(yīng)用服務(wù)器完全透明。設(shè)備往往采用的是一些專用的設(shè)備和通信方式,安裝維護(hù)都比較復(fù)雜。由于兩個中心之間必須有專用的網(wǎng)絡(luò)連接作為數(shù)據(jù)通道,使得該系統(tǒng)對通信線路的要求較高,初期成本非常昂貴。
4.3基于網(wǎng)絡(luò)級的容災(zāi)
主要是指基于虛擬化存儲技術(shù)的災(zāi)備。這種方式無需在應(yīng)用服務(wù)器上安裝任何軟件,遠(yuǎn)程復(fù)制過程不會對應(yīng)用服務(wù)器產(chǎn)生影響。存儲設(shè)備可以完全異構(gòu),不同廠商不同接口的陣列可以混合使用,而且完全不用考慮現(xiàn)有的存儲設(shè)備是否支持遠(yuǎn)程數(shù)據(jù)災(zāi)備,大大降低了方案復(fù)雜程度和實施難度。但是數(shù)據(jù)的寫入必須由虛擬化數(shù)據(jù)管理產(chǎn)品進(jìn)行轉(zhuǎn)發(fā)。
5、小結(jié)
通過建立容災(zāi)系統(tǒng),提供了高可靠的數(shù)據(jù)保護(hù)環(huán)境,降低災(zāi)難發(fā)生造成的損失,提高系統(tǒng)的安全性和可恢復(fù)性。容災(zāi)系統(tǒng)并不是在設(shè)計完成后就不必再管理的項目,它不僅僅是技術(shù),更是一項工程。另外,如何將基于磁盤設(shè)備或者操作系統(tǒng)的數(shù)據(jù)復(fù)制轉(zhuǎn)移到從網(wǎng)絡(luò)業(yè)務(wù)數(shù)據(jù)流層次進(jìn)行數(shù)據(jù)復(fù)制,怎樣提供一個通用的應(yīng)用接口將多樣化的存儲設(shè)備靈活且透明的組織起來,將是以后的研究方向。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/
本文標(biāo)題:淺析中小企業(yè)數(shù)據(jù)容災(zāi)理論和技術(shù)
本文網(wǎng)址:http://www.guhuozai8.cn/html/consultation/1083952229.html