為了確保ERP系統持續穩定運行,并滿足金融監管部門等對歷史數據的查詢需要,數據備份管理面臨更高的要求。數據中心作為銀行信息系統的核心,有效的數據備份管理尤為重要。因其數據具有來源復雜、數據量大的特點,要做好大型數據中心的備份管理,需關注以下幾個問題。
(1)數據備份策略制定的合理性。數據備份策略是指數據備份的基本規則和約定,合理的備份策略應符合以下要求:一是滿足數據有效恢復的需要;二是盡量降低備份的成本和時間。
(2)數據備份策略部署的合規性。由于數量龐大,備份策略需部署到備份工具中,由其自動調度執行。策略部署的合規性是指,備份策略各個要素在工具中的部署正確無誤。
(3)數據備份策略執行的準確性。受系統資源、網絡環境等影響,備份策略可能出現執行錯誤,錯誤類型主要有未執行、執行失敗和執行超出時間窗口等。策略執行的準確性要求應盡量避免問題發生,并在問題發生后能及時處理。
(4)數據備份管理工作的可控性。可控性是指,一方面通過一定的工具和手段確保備份管理工作符合上述三點要求;另一方面建立相應的指標,對備份情況進行統計度量。對于大型數據中心,一般需要采用自動化的工具實現。
一、數據備份策略的制定
1. 備份策略的要素及分類
數據備份策略應包括備份內容、備份頻率、備份方式、保存期限、備份時間窗口、備份介質、介質存放地點等要素。為了易于執行、維護,各個要素的內容應精確、可操作。
2. 影響因素分析
制定備份策略需要綜合考慮一些因素,詳見表1。
表1 備份策略要素的影響因素
3. 策略制定的原則及規范
制定合理的備份策略,需要遵循兩個原則:一是滿足業務數據查詢或系統恢復的需要,包括恢復內容要求、恢復時間點要求、恢復效率要求等;二是在滿足恢復需求的前提下,盡量減少備份冗余,以節約成本、降低耗時。比如通過降低備份頻率,可以降低系統和網絡的使用率,同時減少存儲介質消耗。
為了實現對海量備份需求的統一管理,可根據以上原則編制《備份策略制定規范》,以明確對于給定的備份需求,如何確定各項備份要素。比如,對于數據庫的備份,可編制如表2所示規范。
表2 數據庫備份策略規范示例
二、數據備份策略的部署
備份策略制定完成后,需部署到備份管理軟件中,由其集中調度,實現自動備份。本文以目前主流的Veritas NetBackup(NBU)軟件為例加以說明。
1. 策略部署存在的問題
根據合規性要求,備份策略的各項要素均需正確部署。然而,對于大型數據中心而言,由于策略數量龐大且涉及的系統、網絡及設備等環節較多,部署過程中難免出現操作失誤;同時,若備份策略沒有隨應用版本升級等環境變化及時調整,也可能導致部署錯誤。常見的部署錯誤類型見表3。
表3 備份策略部署問題類型
表4 備份策略執行問題類型
2. 解決措施
為了規避上述問題發生,可對備份策略的部署情況進行檢查,并及時整改發現的問題。一般來說,可采用定期檢查、非定期檢查結合的方式;如果技術條件成熟,可采用實時檢查的方式。
定期檢查主要針對因環境變化導致的部署錯誤。檢查周期根據環境變化的速度而定,一般可采用較長周期內全面檢查、期間進行抽樣檢查的方式。非定期檢查主要針對策略部署過程中的操作失誤,一般在備份策略變更后進行。實時檢查采用自動化檢查工具,對策略的部署情況實時監控。該方式可第一時間發現問題,確保策略部署的合規性。
三、數據備份策略的執行
部署在NBU中的備份策略,一般可由NBU調度自動執行;但受系統資源、網絡環境等影響,備份策略可能出現執行錯誤。以下簡單介紹主要的錯誤類型及處理措施。
1. 策略執行存在的問題
備份策略在執行可能發生如表4 所示問題。
2. 解決措施
要解決策略執行錯誤的問題,降低因此帶來的負面影響,主要應采取以下兩方面的措施:①及時處理。NBU軟件可以提供備份策略執行的日志,根據表4中的判斷依據對日志進行分析,即可發現執行錯誤問題,進而及時進行手工補備。②根源分析及隱患整改。通過對執行出錯問題的統計、根源分析,定位問題的根本原因,并采取措施避免類似問題的再度發生。
四、備份管理工作的自動化及度量指標
通過上述分析可見,僅采用備份工具NBU尚不能保障備份工作的可控性,因此需引入自動化工具,加強對策略的部署、執行等環節的控制,并通過一定的指標進行度量。
1. 策略的維護及發布
功能介紹:將制定的備份策略表導入工具,并提供編輯(增刪改)、查詢、篩選及導出等功能;同時可作為官方工具,將備份策略在數據中心范圍內發布。該功能將便于管理人員從整體上把握備份策略,同時為后續的功能提供基礎數據。
2. 策略部署情況自動檢查
功能介紹:自動檢查備份策略在NBU中的部署是否正確,并列出部署錯誤的策略。檢查項目包括是否已部署、服務器IP、備份內容、備份時間窗口、備份頻率及保存周期等。
實現方法:通過自定義腳本,定期(如每日)導出NBU中的策略部署信息,與備份策略表進行比對。需要指出的是,兩組數據格式上可能有差異,在比對時需要先進行轉換。比如備份策略表中的備份周期是“每日備份”,則NBU中部署為“每月1日、每月2日...每月31日”。
3. 策略執行出錯分析
功能介紹:自動生成執行出錯策略清單,并提供接口供操作人員錄入后續處理信息。
實現方法:通過自定義腳本,定期(如每小時)導出NBU 中的策略執行日志,并根據本文前面介紹的方法進行分析。
4. 策略執行情況統計
功能介紹:匯總所有備份策略的執行情況(包括執行時間、備份數據量、執行出錯信息等),以便進行統計分析,發現問題隱患。
實現方法:通過對NBU 策略執行日志的分析,記錄返回碼、數據量、執行時間等要素,按照表5 格式生成報表。
表5 備份策略執行情況報表設計
5. 備份情況指標設計
(1)備份策略執行準確率。該指標用于評價備份策略執行的準確性,其基礎數據來自備份策略執行情況報表,計算方法為:備份策略執行準確率=(計劃執行的備份策略總數-執行出錯的備份策略數)/計劃執行的備份策略總數。
備份策略執行準確率越高,需要后續人工處理的工作量就越小,備份工作的自動化程度也就越高。要提高該指標,一方面需要確保備份策略部署的合規性;另一方面需要通過對歷史出錯情況的深入分析,對系統、網絡等環境進行優化。
(2)備份數據恢復準確率。該指標用于評價已備份數據在后續使用(即數據恢復)時的有效性,其基礎數據來自于備份數據的恢復驗證結果,計算方法為:備份數據使用正確率=(數據恢復總次數-無法正常恢復的次數)/數據恢復總次數。
備份數據恢復正確率從事后驗證的角度綜合反映了備份管理的工作水平,它不僅體現了備份策略的執行結果,也與備份介質的保管情況密切相關。但由于是抽樣指標,其可靠程度依賴于樣本總容量(即數據恢復總次數)的大小。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:大型數據中心數據備份管理的方法與實踐