在數(shù)據(jù)中心建設(shè)初期,人們很難想到,IT業(yè)務(wù)和數(shù)據(jù)量會發(fā)生翻天覆地的變化。
隨著業(yè)務(wù)量的與日俱增,運營商不停地向數(shù)據(jù)中心填充一堆堆“鐵盒”,導致其內(nèi)部散熱難、數(shù)據(jù)中心宕機等問題頻發(fā)。與此同時,數(shù)據(jù)中心用電管理出現(xiàn)盲點、資產(chǎn)追蹤和設(shè)備關(guān)系管理困難、無法了解機柜內(nèi)的環(huán)境狀況、當設(shè)備變更時無法找到可用的資源等。
同時又適逢大數(shù)據(jù)時代來臨,數(shù)據(jù)量成指數(shù)級增長,數(shù)據(jù)中心向大型化轉(zhuǎn)型,如何成為高效管理成為運營商面臨的首要挑戰(zhàn)。
助力PUE值下降
其實我國數(shù)據(jù)中心面臨的挑戰(zhàn)遠還不止這些。根據(jù)Gartner的報告顯示,數(shù)據(jù)中心的能源消耗占總運營成本高達25%。2011年,美國數(shù)據(jù)中心的耗電量約占全國總耗電量的2%,占全世界總耗電量的1.3%。
但是在我國,2011年數(shù)據(jù)中心共消耗了700億度電,占全國總耗電量的5%,數(shù)據(jù)中心能耗情況更加嚴重。今年2月,工業(yè)和信息化部發(fā)布《工業(yè)節(jié)能“十二五”規(guī)劃》,針對數(shù)據(jù)中心的能耗問題提出明確要求:到2015年,國內(nèi)數(shù)據(jù)中心PUE值需下降8%。
而這8%看似是一個很小的數(shù)字,但是PUE降低1%就需要對IT設(shè)備能源消耗、UPS轉(zhuǎn)化能源消耗、制冷系統(tǒng)能源消耗等數(shù)據(jù)中心不同層面、不同設(shè)備進行更好的節(jié)能措施。
所以是時候?qū)?shù)據(jù)中心進行全方位的管理了。目前,業(yè)內(nèi)普遍認為,DCIM代表了數(shù)據(jù)中心管理的發(fā)展方向。因為它能夠從資產(chǎn)、容量、變更、電源、環(huán)境、能源等多方面對數(shù)據(jù)中心進行全面管理。
DCIM能否夠?qū)?shù)據(jù)中心的整個生命周期進行管理,或者對數(shù)據(jù)中心的設(shè)備進行合理的規(guī)劃和實時的監(jiān)控來解決數(shù)據(jù)中心后期運維成本大幅度提高的“方法論”呢,答案是肯定的。
DCIM的“四步走”
Gartner的報告稱,DCIM已經(jīng)被證明能夠降低20%的運營成本。其他研究機構(gòu)數(shù)據(jù)也表明,DCIM解決方案可將部署新服務(wù)器的時間最高縮短50%,延長數(shù)據(jù)中心的壽命至少五年。
DCIM的出現(xiàn)可以說極大地緩解了數(shù)據(jù)中心整個生命周期的運維成本,所以DCIM成為當下數(shù)據(jù)中心建設(shè)不可缺少的一個重要組成部分,越來越受到人們的重視,那么DCIM到底是如何保證數(shù)據(jù)中心運行在正確的軌跡上的。
首先在設(shè)計階段,DCIM提供了基礎(chǔ)設(shè)施設(shè)計重要的信息。幫助在數(shù)據(jù)中心確定服務(wù)器的最佳位置。沒有這些信息,數(shù)據(jù)中心管理人員必須依靠猜測作出如下關(guān)鍵決定:多少設(shè)備可以放置在一個機架。設(shè)備太少,則浪費了數(shù)據(jù)中心寶貴的資源(空間資源、電力資源和冷卻資源)。設(shè)備太多,則會由于超過可用的資源增大了關(guān)機的危險。
其次在運營階段,DCIM可以幫助數(shù)據(jù)中心強制執(zhí)行的標準流程。這些一致的,可重復的流程,可以減少操作錯誤,而操作錯誤所造成的系統(tǒng)停機多達80%。
在最重要的監(jiān)測階段,DCIM提供業(yè)務(wù)數(shù)據(jù),包括環(huán)境數(shù)據(jù)(溫度、濕度、),電力數(shù)據(jù)(設(shè)備裝置、機架、區(qū)域和數(shù)據(jù)中心水平)和冷卻數(shù)據(jù)。此外,DCIM也可以提供IT數(shù)據(jù),如服務(wù)器資源(如處理器、內(nèi)存、硬盤、網(wǎng)絡(luò))。這些數(shù)據(jù)可以用來在超過閾值時,提醒管理,從而減少了維修時間,提高可用性。
最后在預測分析階段,DCIM分析監(jiān)測階段投入到規(guī)劃階段的關(guān)鍵性能指標。容量規(guī)劃在這一階段進行決策。隨著時間的推移,跟蹤關(guān)鍵資源的使用情況。例如,在決定何時購買新的電力或冷卻設(shè)備可以提供寶貴的借鑒。
可以說DCIM相關(guān)的解決方案可以直觀地顯示數(shù)據(jù)中心所有物理資產(chǎn)和邏輯資產(chǎn)的完整清單,表明機柜和數(shù)據(jù)中心的場地位置和機柜熱負載。數(shù)據(jù)中心的管理人員利用DCIM,就能在實施任何可能嚴重影響數(shù)據(jù)中心性能變化的措施之前,建立復雜的假設(shè)場景,利用模型來模擬任何移動、添加或變化。
然而DCIM并不是某一個廠商單獨的概念,它是一個共同的共識,它是協(xié)助完成數(shù)據(jù)中心運行過程中的重要決策而形成的。企業(yè)只有精準地了解所擁有的資產(chǎn),才能快速的制定出明智的決策,而DCIM剛好能實現(xiàn)這個目標。
解決易宕機難題
數(shù)據(jù)中心工作人員最擔心的事情莫過于服務(wù)器宕機了。7月26日,國外數(shù)家巨頭企業(yè)的數(shù)據(jù)中心發(fā)生宕機事故,包括微軟Window Azure、Google Talk及Twitter相繼傳出災(zāi)情大小不一的斷線情況。
好在微軟不超過兩個小時就解決了問題,并且只對局部用戶產(chǎn)生了影響。但是Google Talk近四個小時的中斷,嚴重影響了Google的用戶形象。
而Twitter的數(shù)據(jù)中心更讓人啼笑皆非,近兩個月以來發(fā)生了兩次宕機,Twitter副總裁Mazen Rawashdeh的解釋是,Twitter架設(shè)了兩套備援服務(wù)器,但這次卻是罕見地兩臺服務(wù)器同時出現(xiàn)問題。
那么除了這些天災(zāi)人禍不可避免的造成了宕機事故,數(shù)據(jù)中心能否提前發(fā)現(xiàn)問題,以便于數(shù)據(jù)中心工作人員做好防范準備,保證用戶的利益,又或者以最快的速度找出問題所在,減少用戶查找問題設(shè)備所在。
Gartner調(diào)查發(fā)現(xiàn),數(shù)據(jù)中心處理宕機所花80%的時間是用于找出錯的服務(wù)器,在擁有超過500臺服務(wù)器的數(shù)據(jù)中心中,如果發(fā)生宕機事故,42%的數(shù)據(jù)中心負責人表示至少需要一天的時間來找到宕機的服務(wù)器。其次,在龐大而臃腫的數(shù)據(jù)中心,服務(wù)器的平均利用率僅為10%-20%。
所以服務(wù)器作為數(shù)據(jù)中心最直接的組成部分,數(shù)據(jù)中心工作人員必須了解所擁有的服務(wù)器的數(shù)量,以及服務(wù)器的位置所在。然而,道理總是說起來容易做起來難,將其付諸實踐并按照企業(yè)需求運作與管理遠比想象的復雜。實施數(shù)據(jù)中心每個資產(chǎn)的管理成為了數(shù)據(jù)中心規(guī)劃者和管理者撓頭的難題。
這時候DCIM就被寄予了厚望。理想情況下,DCIM可以保證數(shù)據(jù)中心里的所有設(shè)備的生命周期運行狀態(tài)都進入中央管理數(shù)據(jù)庫,而且這些信息使用DCIM相關(guān)軟件可以自動發(fā)現(xiàn),并應(yīng)該定期搜索以發(fā)現(xiàn)變化,數(shù)據(jù)中心內(nèi)設(shè)備的每一個變化都應(yīng)該第一時間讓設(shè)備管理者知曉,并且相關(guān)工具應(yīng)自動向設(shè)備管理人員發(fā)出空間、電力、溫控需求改變或是警告。
DCIM能否全面保證數(shù)據(jù)中心的運維安全仍需要跟數(shù)據(jù)中心進行全面的磨合,絕不可能一勞永逸,妄想DCIM在短期內(nèi)保證數(shù)據(jù)中心安全是不可能的,只有經(jīng)過一段時間的試用期,數(shù)據(jù)中心才能完全的在DCIM的保護之下安全運作。
核心關(guān)注:拓步ERP系統(tǒng)平臺是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/
本文標題:實現(xiàn)全生命周期管理 DCIM延壽數(shù)據(jù)中心
本文網(wǎng)址:http://www.guhuozai8.cn/html/news/1051513764.html