容災(zāi)是指系統(tǒng)具有在嚴(yán)重災(zāi)難發(fā)生后的恢復(fù)能力。容災(zāi)是通過(guò)在相當(dāng)距離的異地,建設(shè)一套功能和處理能力與正常生產(chǎn)系統(tǒng)相當(dāng)?shù)膫浞菹到y(tǒng),以確保當(dāng)主系統(tǒng)發(fā)生意外災(zāi)難或有計(jì)劃的長(zhǎng)時(shí)間停機(jī)的情況下,備份系統(tǒng)能夠在短時(shí)間內(nèi)接替、延續(xù)主系統(tǒng)的生產(chǎn)任務(wù)。容災(zāi)系統(tǒng)對(duì)以下情況具有恢復(fù)能力:
①自然災(zāi)害及其它不可抗力的災(zāi)難;長(zhǎng)時(shí)間無(wú)法修復(fù)性停電等機(jī)房外設(shè)的損壞;
②主機(jī)升級(jí)、檢修等計(jì)劃性宕機(jī)等長(zhǎng)時(shí)間機(jī)房設(shè)備無(wú)法正常工作;
③主機(jī)系統(tǒng)、數(shù)據(jù)信息被嚴(yán)重破壞等人為失誤造成的災(zāi)害。
容災(zāi)系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)主要有兩種方式,一是基于應(yīng)用軟件的容災(zāi)備份方式,是根據(jù)應(yīng)用系統(tǒng)本身的特點(diǎn),選擇將主系統(tǒng)處理過(guò)程中收集或使用的與備份系統(tǒng)不同的信息(即增量和變化信息),通過(guò)網(wǎng)絡(luò)傳輸?shù)絺浞菹到y(tǒng)。其特點(diǎn)是:對(duì)應(yīng)用程序須要作一定的改造,將主、備同步機(jī)制嵌入到應(yīng)用程序中去,使主系統(tǒng)能將同步數(shù)據(jù)生成并傳輸?shù)絺浞菹到y(tǒng),而備份系統(tǒng)能根據(jù)收到的同步數(shù)據(jù)進(jìn)行處理,從而產(chǎn)生與主系統(tǒng)相同的處理結(jié)果,達(dá)到主、備系統(tǒng)的一致性。應(yīng)用軟件級(jí)容災(zāi)的優(yōu)點(diǎn)是所需網(wǎng)絡(luò)帶寬較小,對(duì)主、備系統(tǒng)距離沒(méi)有限制,但其缺點(diǎn)是對(duì)于軟件系統(tǒng)的改造和維護(hù)工作量較大。另一種是基于共享磁盤的硬件級(jí)同步,是將主系統(tǒng)在共享磁盤上執(zhí)行底層“寫”操作,然后通過(guò)網(wǎng)絡(luò)發(fā)送到備份系統(tǒng)跟從執(zhí)行,從而達(dá)到主、備系統(tǒng)的數(shù)據(jù)一致性。其特點(diǎn)是:對(duì)應(yīng)用程序基本透明,無(wú)須對(duì)應(yīng)用軟件作較大的改造,便可以實(shí)現(xiàn)容災(zāi)。但是它對(duì)于網(wǎng)絡(luò)帶寬的要求也較高,對(duì)于主、備系統(tǒng)的距離也有一定限制,這是因?yàn)楫?dāng)兩地距離超過(guò)一定長(zhǎng)度后,網(wǎng)絡(luò)由于信號(hào)中斷引起的延時(shí)會(huì)對(duì)主系統(tǒng)的性能造成較大的沖擊。
1 硬件級(jí)容災(zāi)方案設(shè)計(jì)
硬件級(jí)容災(zāi)方式是利用存儲(chǔ)服務(wù)器的遠(yuǎn)程數(shù)據(jù)復(fù)制軟件來(lái)實(shí)現(xiàn)主數(shù)據(jù)中心和備份中心的操作系統(tǒng)、文件系統(tǒng)、數(shù)據(jù)庫(kù)的實(shí)時(shí)拷貝復(fù)制。主、備份中心磁盤陣列本身就可以通過(guò)陣列上的微處理器完成數(shù)據(jù)的實(shí)時(shí)同步,不需要主機(jī)干涉。即實(shí)現(xiàn)遠(yuǎn)程容災(zāi)方案。無(wú)須對(duì)數(shù)據(jù)庫(kù)配置和應(yīng)用系統(tǒng)進(jìn)行任何改動(dòng),可以做到災(zāi)難發(fā)生的同時(shí)實(shí)現(xiàn)應(yīng)用處理過(guò)程的恢復(fù),遠(yuǎn)程備份系統(tǒng)的重新啟動(dòng)可以做到像一般電源故障后的重新啟動(dòng)那么簡(jiǎn)單。
將主機(jī)服務(wù)器的操作系統(tǒng)、數(shù)據(jù)庫(kù)及應(yīng)用程序安裝在獨(dú)立的具有備份功能的磁盤陣列上,并將磁盤陣列上的數(shù)據(jù)進(jìn)行遠(yuǎn)程鏡像,同樣可以實(shí)現(xiàn)主機(jī)操作系統(tǒng)的遠(yuǎn)程容災(zāi)。當(dāng)在生產(chǎn)系統(tǒng)上對(duì)操作系統(tǒng)參數(shù)、數(shù)據(jù)庫(kù)配置文件和應(yīng)用程序參數(shù)進(jìn)行修改時(shí),同時(shí)也復(fù)制到備份中心,無(wú)需系統(tǒng)管理員在備份系統(tǒng)的操作系統(tǒng)磁盤上手工重復(fù)這些配置參數(shù)的修改,一旦生產(chǎn)中心發(fā)生突發(fā)性故障,備份中心使用備份陣列上的外掛操作系統(tǒng)盤鏡像,與主中心相同的系統(tǒng)配置參數(shù)迅速引導(dǎo)主機(jī),恢復(fù)業(yè)務(wù)系統(tǒng)的運(yùn)行。
2 存儲(chǔ)區(qū)域網(wǎng)絡(luò)
2.1 網(wǎng)絡(luò)存儲(chǔ)技術(shù)
隨著光纖通道技術(shù)的出現(xiàn)和網(wǎng)絡(luò)技術(shù)的發(fā)展,存儲(chǔ)的底層技術(shù)逐漸向網(wǎng)絡(luò)存儲(chǔ)方向發(fā)展。網(wǎng)絡(luò)存儲(chǔ)可以實(shí)現(xiàn)數(shù)據(jù)的安全存儲(chǔ)管理,實(shí)現(xiàn)不同平臺(tái)之間的數(shù)據(jù)共享,為用戶提供不問(wèn)斷的數(shù)據(jù)訪問(wèn)。
存儲(chǔ)區(qū)域網(wǎng)絡(luò)是網(wǎng)絡(luò)存儲(chǔ)技術(shù)發(fā)展的主流方向,它是以Gb帶寬實(shí)現(xiàn)計(jì)算機(jī)和存儲(chǔ)器之間的通訊,結(jié)合了I/O通道技術(shù)、局域網(wǎng)模型、大容量存儲(chǔ)器的技術(shù)優(yōu)點(diǎn)。它消除了服務(wù)器傳輸處理的瓶頸。適合大數(shù)據(jù)量傳輸、實(shí)時(shí)數(shù)據(jù)處理。獨(dú)立于服務(wù)器網(wǎng)絡(luò)系統(tǒng)之外,幾乎擁有無(wú)限存儲(chǔ)能力的高速存儲(chǔ)網(wǎng)絡(luò),這種網(wǎng)絡(luò)采用高速的光纖通道作為傳輸媒體。存儲(chǔ)區(qū)域網(wǎng)絡(luò)SAN(Storage Area Network,SAN)可使服務(wù)器與存儲(chǔ)設(shè)備之間進(jìn)行“any to any”的連接通信,實(shí)現(xiàn)多服務(wù)器獨(dú)立地共享一個(gè)陣列子系統(tǒng)、共享—個(gè)自動(dòng)庫(kù),實(shí)現(xiàn)數(shù)據(jù)的共享和集中的管理,進(jìn)而完成快速、大容量和安全可靠的數(shù)據(jù)存儲(chǔ)。
2.2 SAN的拓?fù)浣Y(jié)構(gòu)
SAN的組成包含了存儲(chǔ)介質(zhì)(磁盤陣列、磁帶庫(kù)等)、存儲(chǔ)連接器件(光纖交換機(jī)、適配器等)、SAN管理服務(wù)器(見(jiàn)圖1)。網(wǎng)絡(luò)連接包含SAN網(wǎng)絡(luò)連接和以太網(wǎng)局域網(wǎng)連接兩部分。
采用SAN架構(gòu)時(shí),如果采用l臺(tái)光纖交換機(jī)和多臺(tái)使用SAN的應(yīng)用服務(wù)器相連,光纖交換機(jī)就成了系統(tǒng)中的單點(diǎn)故障隱患點(diǎn)。為了提高存儲(chǔ)系統(tǒng)的安全性和冗余性,在實(shí)際應(yīng)用中采用2臺(tái)光纖交換機(jī)。所有需要接人SAN存儲(chǔ)子系統(tǒng)的應(yīng)用服務(wù)器都配置兩塊光纖卡,每臺(tái)服務(wù)器和兩臺(tái)光纖交換機(jī)之間都有物理連接,整個(gè)存儲(chǔ)子系統(tǒng)形成了一個(gè)全冗余的架構(gòu)。當(dāng)有某塊光纖卡或某臺(tái)光纖交換機(jī)發(fā)生故障現(xiàn)象時(shí),整個(gè)存儲(chǔ)子系統(tǒng)不會(huì)癱瘓。
3 容災(zāi)系統(tǒng)的結(jié)構(gòu)和實(shí)現(xiàn)
基于SAN的硬件級(jí)異地容災(zāi)系統(tǒng)包括生產(chǎn)數(shù)據(jù)中心(主)和備份數(shù)據(jù)中心(備)兩部分組成(見(jiàn)圖2),分別位于不同的地理位置(同城異地)。兩個(gè)數(shù)據(jù)中心的數(shù)據(jù)存儲(chǔ)都是基于SAN的,通過(guò)光纖通道交換機(jī)將本地磁盤陣列和異地容災(zāi)磁盤陣列組成SAN網(wǎng)絡(luò)存儲(chǔ)。整個(gè)系統(tǒng)中的網(wǎng)絡(luò)環(huán)境包括兩部分:
①是公網(wǎng)部分(見(jiàn)圖2上半部分所示),主要承擔(dān)服務(wù)器與服務(wù)器之間、服務(wù)器與客戶機(jī)之間的網(wǎng)絡(luò)通訊;
②是SAN管理網(wǎng)段,主要承擔(dān)SAN網(wǎng)絡(luò)存儲(chǔ)中光纖交換機(jī)與設(shè)備之間、異地交換機(jī)之間的網(wǎng)絡(luò)通訊。
主數(shù)據(jù)中心采用高可靠性集群解決方案設(shè)計(jì),通過(guò)安裝高可靠性管理軟件組成多機(jī)高可靠性環(huán)境。數(shù)據(jù)存儲(chǔ)在主數(shù)據(jù)中心的磁盤陣列中,磁帶庫(kù)作為日常備份使用。主數(shù)據(jù)中心還要配置一臺(tái)備份管理服務(wù)器,直接連接到存儲(chǔ)磁盤陣列和磁帶庫(kù),用來(lái)管理和控制系統(tǒng)的日常數(shù)據(jù)的備份。類似主數(shù)據(jù)中心,在異地備份數(shù)據(jù)中心配置相同結(jié)構(gòu)的存儲(chǔ)環(huán)境。兩個(gè)數(shù)據(jù)中心之間采用高性能骨干網(wǎng),為兩個(gè)數(shù)據(jù)中心提供高帶寬、高可靠的連接通道。通過(guò)使用容災(zāi)軟件自動(dòng)實(shí)現(xiàn)主數(shù)據(jù)中心存儲(chǔ)數(shù)據(jù)與備份數(shù)據(jù)中心數(shù)據(jù)的實(shí)時(shí)完全備份。在本地?cái)?shù)據(jù)及整個(gè)應(yīng)用系統(tǒng)出現(xiàn)災(zāi)難時(shí),系統(tǒng)至少在異地保存有一份可用的關(guān)鍵業(yè)務(wù)的鏡像數(shù)據(jù),該數(shù)據(jù)是本地生產(chǎn)數(shù)據(jù)的完全實(shí)時(shí)拷貝。
在方案實(shí)現(xiàn)上,主要分為以下幾個(gè)步驟:
①在備份數(shù)據(jù)中心,采購(gòu)和生產(chǎn)數(shù)據(jù)中心一致的光纖交換機(jī)和存儲(chǔ)設(shè)備,構(gòu)成SAN環(huán)境;
②生產(chǎn)數(shù)據(jù)中心和備份數(shù)據(jù)中心之間通過(guò)裸光纖連接起來(lái);
③在每個(gè)需要容災(zāi)的應(yīng)用服務(wù)器主機(jī)上,部署容災(zāi)軟件;
④通過(guò)容災(zāi)軟件提供的跨陣列磁盤鏡像技術(shù),實(shí)現(xiàn)同城異地間的數(shù)據(jù)容災(zāi)。
4 容災(zāi)系統(tǒng)的災(zāi)難處理
一個(gè)完備的容災(zāi)系統(tǒng),除了在數(shù)據(jù)災(zāi)難發(fā)生時(shí)完成容災(zāi)備份的使命,還要考慮系統(tǒng)本身的可維護(hù)性和可操作性,以及對(duì)系統(tǒng)盡可能快的恢復(fù)。
當(dāng)生產(chǎn)中心的磁盤系統(tǒng)發(fā)生故障(災(zāi)難),導(dǎo)致應(yīng)用服務(wù)器無(wú)法訪問(wèn)本地?cái)?shù)據(jù),容災(zāi)系統(tǒng)會(huì)自動(dòng)隔離生產(chǎn)中心的磁盤,讓應(yīng)用服務(wù)器直接對(duì)備份數(shù)據(jù)中心的數(shù)據(jù)進(jìn)行訪問(wèn)。應(yīng)用和數(shù)據(jù)庫(kù)不會(huì)因?yàn)樯a(chǎn)中心的磁盤系統(tǒng)故障而停止;更重要的是,避免了發(fā)生數(shù)據(jù)庫(kù)損壞(數(shù)據(jù)一致性風(fēng)險(xiǎn))的可能。當(dāng)備份數(shù)據(jù)中心或生產(chǎn)數(shù)據(jù)中心到備份數(shù)據(jù)中心的光纖鏈路發(fā)生故障,導(dǎo)致了鏡像的破壞,容災(zāi)系統(tǒng)將自動(dòng)只與狀態(tài)健康的磁盤陣列繼續(xù)工作,與生產(chǎn)數(shù)據(jù)中心發(fā)生故障時(shí)的處理是相同的。這樣,即使在無(wú)人值守的情況下,也能夠確保業(yè)務(wù)系統(tǒng)全天候的正常運(yùn)行。
磁盤系統(tǒng)故障修復(fù)之后,要盡可能快的將遠(yuǎn)程鏡像系統(tǒng)恢復(fù)起來(lái),實(shí)現(xiàn)鏡像的重新同步,以確保容災(zāi)的功能繼續(xù)得以實(shí)現(xiàn),這也是容災(zāi)方案是否成功的關(guān)鍵因素。目前鏡像同步的技術(shù)大多是基于日志功能的,當(dāng)因故導(dǎo)致鏡像被破壞時(shí),災(zāi)難恢復(fù)軟件會(huì)通過(guò)日志記錄此后發(fā)生變化的業(yè)務(wù)數(shù)據(jù);一旦故障被修復(fù),會(huì)根據(jù)日志記錄的情況,將更新的業(yè)務(wù)數(shù)據(jù)(變化量)增量同步到災(zāi)難端,從而實(shí)現(xiàn)鏡像的完全同步。在鏡像快速同步的過(guò)程中,用戶的應(yīng)用始終可以正常工作。整個(gè)同步過(guò)程的發(fā)起,管理員只需要執(zhí)行簡(jiǎn)單命令即刻完成。
5 結(jié)束語(yǔ)
本系統(tǒng)適用于備份數(shù)據(jù)中心和主數(shù)據(jù)中心的近距離容災(zāi)(距離小于100公里),容災(zāi)級(jí)別相對(duì)較低。但投資規(guī)模較小,日常維護(hù)費(fèi)用少,并且可以將已有的投資與長(zhǎng)期的存儲(chǔ)解決方案結(jié)合起來(lái)。當(dāng)主、備機(jī)房的距離更遠(yuǎn)(位于不同城市)時(shí),光纖連接則需要加上光纖延伸器。儲(chǔ)存上則需要專用的存儲(chǔ)服務(wù)器,如IBM TotalStorage系列產(chǎn)品,容災(zāi)費(fèi)用大,僅適用于大型企業(yè)。
在企業(yè)將來(lái)有更高的容災(zāi)需求時(shí),只需對(duì)現(xiàn)有系統(tǒng)結(jié)構(gòu)進(jìn)行部分?jǐn)U充,就可以實(shí)現(xiàn)。擴(kuò)充的內(nèi)容主要包括網(wǎng)絡(luò)、應(yīng)用及數(shù)據(jù)庫(kù)服務(wù)器、IP等資源,以及各資源之間的良好協(xié)調(diào)。這樣,在備份數(shù)據(jù)中心建立一套完整的與生產(chǎn)數(shù)據(jù)中心相當(dāng)?shù)膫浞輵?yīng)用系統(tǒng),從而實(shí)現(xiàn)更高級(jí)別的應(yīng)用級(jí)容災(zāi)。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/
本文標(biāo)題:基于SAN存儲(chǔ)模式的異地容災(zāi)系統(tǒng)
本文網(wǎng)址:http://www.guhuozai8.cn/html/support/1112153829.html