容災是企業數據管理中的一個重要環節。近年來,國內頻頻發生的自然災害事件給企業CIO提出了一個問題,災難備份到底要做成什么程度才能滿足企業的業務連續性要求?
一 災備建設參考法規和標準
1.1 信息系統災難恢復規范(GB/T 20988-2007)
我國至今已發布一系列的文件對災難備份建設進行指導和監督,其中國務院信息化工作辦公室2005年發布的《重要信息系統災難恢復指南》最為重要。2007年7月,《重要信息系統災難恢復指南》正式升級成為國家標準《信息系統災難恢復規范》(GB/T 20988-2007 )。這是中國災難備份與恢復行業的第一個國家標準,并在2007年11月1日開始正式實施。
我國災難恢復等級劃分:
大致可以分為兩類:數據類、應用類。
第1級:數據介質轉移;
第2級:備用場地支持;
第3級:電子傳送和部分設備支持;
第4級:電子傳送和完整設備支持;
第5級:實時數據傳送及完整設備支持;
第6級:數據零丟失和遠程。
1.2 災備建設遵循標準
各種災難時間按照發生頻率可排序如下:軟災難、硬件災難、自然災難。
因此,軟災難的防范是數據災備建設過程中重點考慮對象,同時要兼顧到硬件災難與自然災難。
從技術上看,衡量災備系統有兩個主要指標:RPO(Recovery Point Object)和RTO(Recovery Time Object),其中RPO代表了當災難發生時允許丟失的數據量;而RTO則代表了系統恢復的時間。
在數據保護和災備系統建設中主要有三個指標:
PTO(Recovery Time Object,恢復時間目標)
RTO是將信息系統“從災難造成的故障或癱瘓狀態恢復到可正常運行狀態,并將其支持的業務功能從災難造成的不正常狀態恢復到可接受狀態”所需時間,其中包括備份數據恢復到可用狀態所需時間、數據處理系統切換時間、備用網絡切換時間等,該指標用以衡量災備方案的業務恢復能力。
RPO(Recovery Point:Objective,恢復點目標)
RPO是指業務系統所允許的災難過程中的最大數據丟失量。數據保護的根本目的,就是在一定的預算和技術基礎上,要求實現盡量小的RTO、RPO。當發生各種故障時,可以進行快速的系統和數據恢復,使得系統繼續發揮作用,提供數據服務和業務服務能力。
RR(Recovery Radius,災備半徑)
RR 即主站點與備份站點間的距離,指災備系統能夠承受多大物理距離內的災難,應對自然災害。
二 應用級容災的功能特性以及傳統容災方式簡介
容災,顧名思義是業務系統在災難發生時的承受和抵御能力。業務系統通過容災機制來保證數據的安全可靠,提高系統的可用性,并確保業務的連續性。從對用戶整個業務連續性的保障程度來看,容災可以分為兩個級別:數據級別和應用級別。
2.1 數據級別
數據級別容災的關注點在于數據,即災難發生后可以確保用戶原有的數據不會丟失或者遭到破壞。數據級的容災較為基礎,數據級別容災是保障數據可用的最基本要求,當數據丟失時能夠保證應用系統可以重新得到所有數據。該級別災難恢復時間較長,延遲大,仍然存在較大風險,盡管有時候用戶原有數據沒有丟失,應用也會被中斷,用戶業務也會被迫停止。但這種方案的特點是成本低、構建簡單。
2.2 應用級別
對于業務應用繁多、而且系統需要保持7 X 24小時連續運行的企業來說,顯然需要高級別的應用容災系統來滿足他們的需求。應用級容災是在數據級容災的基礎上,再把執行應用處理能力復制一份。應用級容災系統能提供不間斷的應用服務,讓用戶應用的服務請求能夠透明地繼續運行,而感受不到災難的發生,保證業務系統提供的服務完整、可靠、安全,以及業務的連續。
三 構建在虛擬化環境中的容災系統為信息系統建設帶來的變革
3.1 虛擬化概述
虛擬化就是淡化用戶對于物理計算資源,如處理器、內存、I/O設備的直接訪問,取而代之的是用戶訪問邏輯的資源,而后臺的物理連接則由虛擬化技術來實現和管理。從而實現了靈活性、可靠性、可擴展性、安全性、降低成本。
3.2 如何定位業務連續性
業務連續性就是將宕機時間縮短到最小。構建業務連續性解決方案的需求有以下四點:
(1)構建在可靠的平臺之上:這個平臺本身的可用性必須很高,并且不依賴操作系統或特定驅動裝置;
(2)獨立于物理架構之外:這樣物理架構的缺陷將不會導致業務系統的不穩定;
(3)貫穿操作系統和應用程序的保護:雖然我們需要保護的是業務系統,但是與業務系統息息相關的操作系統、配置文件等也必須考慮進來;
(4)廣譜宕機因素的保護能力:這個系統必須能對計劃內與計劃外的宕機提供保護,同時對組件、服務器、數據以及站點災難同樣要提供保護。
在虛擬化平臺之上為業務連續性的每一個層面都能提供保護,當這些保護措施不足以滿足我們業務連續性的要求時,還有更多的、專注單一層面解決方案,可以和虛擬化平臺有機的進行結合。例如:在VMware環境中Vizioncore VVSP的各個組件可以提供對虛擬化平臺更加優化的管理,這其中包含容災管理。
3.3 災難恢復需考慮的要素
3.3.1 想要達成什么樣的災難恢復目標很重要
災難恢復分為以下三種:
本地高可用:冷備,有備機是否就已足夠?熱備,MSCS?VCS?VMware HA?VMware FT?系統級切換還是應用級別的切換?
遠程數據保護:僅有數據足夠嗎?在災難恢復發生時,怎么讓數據能夠使用起來?僅有應用足夠嗎?在災難恢復發生時,怎么去獲得生產數據讓應用能夠發揮作用?
任何情況下不間斷運行:真的需要實時切換嗎?實時切換的巨大投入(硬件、軟件、線路、人力)是否能購承受?
3.3.2 災難恢復的實現方式
基于應用程序災難恢復解決方案:應用程序在本地、遠端雙寫I/O,需要從寫應用程序,周期長,不穩定;
基于數據庫復制的遠程災難恢復解決方案:數據庫本身的遠程復制(Oracle DB Guard),只能復制數據庫自身的文件;
基于主機的遠程數據復制軟件災難恢復解決方案:復制軟件在卷管理器層面截獲I/O,遠程復制,支持異構存儲平臺,但是低效率、對主機的運行有影響,配置復雜;
基于存儲的遠程數據復制災難恢復解決方案:智能存儲遠程數據復制,相對安全、成熟、簡單、高效、節省資源,但是對存儲的要求比較高,一般要求同構平臺;
基于虛擬化平臺的遠程數據復制軟件災難恢復解決方案:復制軟件在虛擬化存儲層面截獲I/0,遠程復制,支持異構/同構存儲平臺。
在虛擬架構下系統和數據采用同樣的方式來保護,系統也是數據,保護系統的同時就保護了數據,反之亦然。虛擬機既存儲系統也存儲數據,整個系統封裝在文件中:硬件配置,操作系統,應用及數據。這樣我依靠虛擬化的硬件獨立性,可以可靠地將虛擬機恢復到其他的硬件服務器上,并可將整個系統迅速轉移到災難恢復中心;由于關于系統的所有信息都以數據的方式存儲在磁盤上,我們可以依靠虛擬化的封裝性,用保護數據的方式保護整個系統;我們可以依靠虛擬化的分區和整合特性,保障生產中心與災備中心服務器的比例不在是1:1;同時我們可以依靠虛擬化的資源池化特性,確保生產中心與災備中心基礎架構的一致性。
這樣使得在虛擬化環境中用任何你喜歡的方法(自動或者手動)將數據(包含系統、應用及數據)復制過去,然后啟動虛擬機即可,從而獲得最好的RTO。
四 總結
通過在虛擬化環境中部署應用級容災軟件,實現司信息系統高效安全的“兩帶三中心”容災系統,提高了信息系統的穩定性,數據的安全性,促進信息化安全平穩運行。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文網址:http://www.guhuozai8.cn/html/consultation/1083974914.html