1 概述
中國(guó)科學(xué)院資源規(guī)劃項(xiàng)目(Academia Resource Planning,ARP),是實(shí)現(xiàn)中國(guó)科學(xué)院資源規(guī)劃管理的信息系統(tǒng)工程,目前采用分布式部署方式,每個(gè)研究院所單獨(dú)部署一套ARP 系統(tǒng),各節(jié)點(diǎn)間通過(guò)VPN 設(shè)備建立虛擬專網(wǎng)進(jìn)行連接,與公網(wǎng)進(jìn)行邏輯隔離。這種部署方式一方面造成本地系統(tǒng)高可靠性配置的硬件成本增加,而另一方面各節(jié)點(diǎn)間硬件資源不能有效地共享利用,且分布式運(yùn)運(yùn)營(yíng)維護(hù)導(dǎo)致效率低下、監(jiān)控管理復(fù)雜、系統(tǒng)升級(jí)維護(hù)困難,每新增一個(gè)節(jié)點(diǎn)需要重新購(gòu)置服務(wù)器、安全設(shè)備和存儲(chǔ)等相關(guān)硬件資源。隨著應(yīng)用系統(tǒng)規(guī)模的增大,為了降低硬件成本、系統(tǒng)管理以及運(yùn)維成本,減少系統(tǒng)維護(hù)與備份宕機(jī)時(shí)間,提高系統(tǒng)的安全性和系統(tǒng)運(yùn)行穩(wěn)定性,實(shí)現(xiàn)對(duì)分布系統(tǒng)的集中運(yùn)維管理和快速升級(jí)部署等,本文提出了一種基于虛擬化技術(shù)的ARP 私有云服務(wù)解決方案,通過(guò)虛擬化技術(shù)對(duì)底層硬件平臺(tái)進(jìn)行整合利用。
2 虛擬化與云服務(wù)
2.1 服務(wù)器虛擬化
服務(wù)器虛擬化是指在一個(gè)硬件平臺(tái)上模擬多個(gè)獨(dú)立的、和真實(shí)硬件指令集結(jié)構(gòu)相同的虛擬硬件系統(tǒng),每個(gè)虛擬硬件系統(tǒng)上可以運(yùn)行不同的操作系統(tǒng)。主要通過(guò)虛擬監(jiān)視器(Virtual Machine Monitor, VMM)實(shí)現(xiàn)。VMM 是計(jì)算機(jī)硬件和操作系統(tǒng)之間的軟件層,它運(yùn)行在特權(quán)模式,負(fù)責(zé)管理和隔離上層運(yùn)行的多個(gè)虛擬機(jī)(VM),為這些虛擬機(jī)提供安全獨(dú)立的運(yùn)行環(huán)境,同時(shí)也為每個(gè)虛擬機(jī)虛擬一套與真實(shí)硬件無(wú)關(guān)的虛擬硬件環(huán)境。虛擬機(jī)運(yùn)行在非特權(quán)模式下,每個(gè)虛擬機(jī)上運(yùn)行著獨(dú)立的操作系統(tǒng)。常見的虛擬化軟件有Vmware、Microsoft Virtual Server、Xen、KVM、OpenVZ等。
2.2 云服務(wù)
NIST 指出云計(jì)算是一種能夠方便、按需從網(wǎng)絡(luò)訪問(wèn)共享的可配置計(jì)算資源(如網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)、應(yīng)用程序和服務(wù))池的模型,且只需最少的管理或服務(wù)提供方交互即可快速供應(yīng)和發(fā)布該模型。虛擬化技術(shù)為云計(jì)算模型中的資源管理提供了一種有效的解決辦法,而云服務(wù)即是基于云計(jì)算模式對(duì)外提供按需個(gè)性化的服務(wù)方式。
2.3 APCS 私有云
借助于虛擬化技術(shù)和云服務(wù)模式,建設(shè)ARP 內(nèi)部業(yè)務(wù)管理系統(tǒng)的私有云服務(wù)(ARP Private Cloud Services, APCS)平臺(tái)。首先通過(guò)虛擬化技術(shù)對(duì)目前的分布式硬件資源進(jìn)行整合,建設(shè)區(qū)域分中心,每個(gè)區(qū)域分中心支持本區(qū)域內(nèi)應(yīng)用系統(tǒng)運(yùn)行環(huán)境,分中心間通過(guò)高速專用網(wǎng)絡(luò)建立連接,形成私有云基礎(chǔ)架構(gòu)平臺(tái)。通過(guò)集中式私有云管理平臺(tái)建設(shè),實(shí)現(xiàn)對(duì)區(qū)域分中心內(nèi)部資源的分配管理和運(yùn)維監(jiān)控,并實(shí)現(xiàn)跨分中心
間的資源調(diào)度,真正達(dá)到系統(tǒng)資源跨地域的按需分配,而作為業(yè)務(wù)終端用戶不必關(guān)心訪問(wèn)應(yīng)用的物理位置、資源使用情況等,達(dá)到透明化的按需使用服務(wù)。
3 APCS 方案設(shè)計(jì)
3.1 系統(tǒng)現(xiàn)狀
目前ARP 系統(tǒng)采用分布式方式部署在全院100 多個(gè)科研院所中,遍布20 多個(gè)城市,每個(gè)部署節(jié)點(diǎn)運(yùn)行的應(yīng)用系統(tǒng)包括2 個(gè)數(shù)據(jù)庫(kù)服務(wù)和3 個(gè)業(yè)務(wù)應(yīng)用服務(wù),硬件資源配置為HP380G6 服務(wù)器3 臺(tái)~4 臺(tái)(雙路四核Intel CPU 2.26 GHz,16 GB 內(nèi)存),經(jīng)監(jiān)測(cè)每臺(tái)物理主機(jī)系統(tǒng)日常資源消耗CPU為10%,內(nèi)存為2 GB。監(jiān)測(cè)結(jié)果表明,目前硬件配置資源還有很大利用空間,將硬件資源進(jìn)行虛擬化整合可以提高系統(tǒng)硬件資源利用率,同時(shí)解決了為提高業(yè)務(wù)系統(tǒng)的高可靠性,而在不增加服務(wù)器數(shù)量的情況下,使用虛擬機(jī)化技術(shù)進(jìn)行系統(tǒng)運(yùn)行環(huán)境的冗余配置。
3.2 技術(shù)平臺(tái)架構(gòu)
ARP 私有云服務(wù)APCS 主要由ARP 私有云服務(wù)基礎(chǔ)架構(gòu)平臺(tái)(ARP Cloud Services Infrastructure Platform, ACSIP)和ARP 私有云服務(wù)管理平臺(tái)(ARP Cloud Services ManagementPlatform, ACSMP)兩部分構(gòu)成,如圖1 所示。
圖1 私有云服務(wù)APCS 管理架構(gòu)
ACSIP 由若干個(gè)區(qū)域節(jié)點(diǎn)(Area Node, AN)組成,主要實(shí)現(xiàn)對(duì)系統(tǒng)硬件資源的虛擬化整合,提高系統(tǒng)資源利用率,并對(duì)ARP 系統(tǒng)業(yè)務(wù)應(yīng)用進(jìn)行組件化模板分類,支持應(yīng)用的快速部署功能,為業(yè)務(wù)用戶提供應(yīng)用服務(wù)。ACSMP 即是對(duì)ARP云服務(wù)環(huán)境進(jìn)行管理配置,為資源申請(qǐng)者提供虛擬資源的分配和管理,為系統(tǒng)維護(hù)人員提供系統(tǒng)的日常運(yùn)行維護(hù)和監(jiān)控,為決策人員定期生成系統(tǒng)運(yùn)行健康報(bào)告和資源需求報(bào)告,并進(jìn)行私有云安全管理等。
3.3 區(qū)域中心節(jié)點(diǎn)
為更好整合系統(tǒng)硬件資源,提高資源利用率,將目前分布式系統(tǒng)進(jìn)行區(qū)域集中,建立APCS 區(qū)域節(jié)點(diǎn)AN,每個(gè)AN搭建基于FC-SAN 的存儲(chǔ)網(wǎng)絡(luò)結(jié)構(gòu)。對(duì)于前端主機(jī)服務(wù)器進(jìn)行硬件資源虛擬化設(shè)置,虛擬多個(gè)主機(jī)系統(tǒng),所有虛擬機(jī)文件存放在共享存儲(chǔ)上,每個(gè)分布式業(yè)務(wù)系統(tǒng)分配虛擬服務(wù)器資源(虛擬網(wǎng)絡(luò)、虛擬CPU、虛擬內(nèi)存、虛擬存儲(chǔ))。各虛擬主機(jī)可以在物理服務(wù)器之間進(jìn)行高可靠性、動(dòng)態(tài)遷移、容錯(cuò)等功能設(shè)置實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)連續(xù)性。各AN 間高速互聯(lián)形成內(nèi)部私有云基礎(chǔ)資源池平臺(tái)。
4 APCS 技術(shù)實(shí)現(xiàn)
4.1 ACSIP
ARP 私有云服務(wù)基礎(chǔ)架構(gòu)平臺(tái)ACSIP 主要包括硬件資源基礎(chǔ)架構(gòu)層IaaS(Infrastructure as a Service)、ARP 系統(tǒng)平臺(tái)服務(wù)層APaaS(ARP Platform as a Service)和ARP 系統(tǒng)應(yīng)用服務(wù)層ASaaS(ARP Software as a Service),如圖2 所示。
圖2 APCS 實(shí)現(xiàn)技術(shù)架構(gòu)
IaaS 層主要實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)、存儲(chǔ)和服務(wù)器等物理資源的虛擬化,形成虛擬資源池。用戶資源的獲取可以從虛擬資源池中進(jìn)行分配,并能夠?qū)Ψ峙涞馁Y源在使用過(guò)程中根據(jù)需求進(jìn)行動(dòng)態(tài)調(diào)整,為上層應(yīng)用服務(wù)提供資源保障。
APaaS 層即根據(jù)ARP 業(yè)務(wù)系統(tǒng)需求,對(duì)所需Linux 操作系統(tǒng)、Oracle 數(shù)據(jù)庫(kù)系統(tǒng)、JBoss 應(yīng)用服務(wù)系統(tǒng)和消息中間件等平臺(tái)層進(jìn)行組件化模板配置,便于業(yè)務(wù)快速擴(kuò)展部署。ASaaS 層即將目前ARP 系統(tǒng)中業(yè)務(wù)管理系統(tǒng)、公共事務(wù)系統(tǒng)和信息管理與服務(wù)平臺(tái)等業(yè)務(wù)應(yīng)用進(jìn)行封裝部署,直接提供給終端業(yè)務(wù)用戶,終端用戶只需申請(qǐng)符合自己權(quán)限的用戶賬號(hào),即可直接登錄系統(tǒng)進(jìn)行業(yè)務(wù)系統(tǒng)使用。
4.2 ACSMP
ARP 私有云服務(wù)管理平臺(tái)ACSMP 實(shí)現(xiàn)對(duì)ARP 云服務(wù)環(huán)境的管理,主要包括用戶管理、資源管理、運(yùn)維管理、監(jiān)控管理和安全管理等。用戶管理實(shí)現(xiàn)用戶的創(chuàng)建、修改和注銷,以及用戶的角色授權(quán)管理等。資源管理實(shí)現(xiàn)對(duì)系統(tǒng)資源申請(qǐng)、分配、調(diào)整、回收管理。運(yùn)維管理實(shí)現(xiàn)模板配置、動(dòng)態(tài)遷移、負(fù)載均衡、高可靠性管理。監(jiān)控管理實(shí)現(xiàn)網(wǎng)絡(luò)監(jiān)控、虛擬機(jī)監(jiān)控、主機(jī)監(jiān)控管理。安全管理實(shí)現(xiàn)網(wǎng)絡(luò)安全管理、數(shù)據(jù)安全管理、服務(wù)器安全管理。
云管理平臺(tái)是非侵入式高度模塊化、采用公開的標(biāo)準(zhǔn)協(xié)議的管理平臺(tái),系統(tǒng)采用組件化設(shè)置,由云控制器、集群控制器、節(jié)點(diǎn)控制器、存儲(chǔ)控制器等核心組件組成。各個(gè)控制器分別完成不同的功能,相對(duì)獨(dú)立,從而保證系統(tǒng)的可擴(kuò)展性。平臺(tái)實(shí)現(xiàn)為資源申請(qǐng)者進(jìn)行物理資源的分配和管理,對(duì)于申請(qǐng)者不必關(guān)心具體物理存放位置,為系統(tǒng)維護(hù)人員提供系統(tǒng)的日常運(yùn)行維護(hù)和監(jiān)控,為決策人員定期生成系統(tǒng)運(yùn)行健康報(bào)告和資源需求報(bào)告。
5 APCS 關(guān)鍵技術(shù)實(shí)現(xiàn)
5.1 資源動(dòng)態(tài)分配算法
對(duì)于各物理主機(jī)上虛擬資源池中資源分配可以使用改進(jìn)的線性銀行家分配算法、循環(huán)銀行家分配算法或最大可用資源銀行家分配算法。
銀行家算法[4]是一種最有代表性的避免死鎖的資源分配算法。當(dāng)進(jìn)程首次申請(qǐng)資源時(shí),要測(cè)試該進(jìn)程對(duì)資源的最大需求量,如果系統(tǒng)現(xiàn)存的資源可以滿足它的最大需求量則按當(dāng)前的申請(qǐng)量分配資源,否則就推遲分配。當(dāng)進(jìn)程在執(zhí)行中繼續(xù)申請(qǐng)資源時(shí),先測(cè)試該進(jìn)程已占用的資源數(shù)與本次申請(qǐng)的資源數(shù)之和是否超過(guò)了該進(jìn)程對(duì)資源的最大需求量。若超過(guò)則拒絕分配資源,若沒(méi)有超過(guò)則再測(cè)試系統(tǒng)現(xiàn)存的資源能否滿足該進(jìn)程尚需的最大資源量,若能滿足則按當(dāng)前的申請(qǐng)量分配資源,否則也要推遲分配。線性銀行家分配算法是指當(dāng)有虛擬機(jī)資源申請(qǐng)時(shí),優(yōu)先在一個(gè)主機(jī)內(nèi)進(jìn)行資源分配,當(dāng)?shù)谝慌_(tái)主機(jī)的資源分配完畢后再進(jìn)行下一臺(tái)主機(jī)資源分配。此種分配算法的主要優(yōu)點(diǎn)為最大化利用啟動(dòng)主機(jī)資源,沒(méi)有分配到資源使用的主機(jī)可以在待機(jī)狀態(tài)下,節(jié)省了能源消耗,主要缺點(diǎn)為主機(jī)間沒(méi)有實(shí)現(xiàn)負(fù)載均衡。
循環(huán)銀行家分配算法是當(dāng)有虛擬機(jī)申請(qǐng)資源時(shí),按照主機(jī)順次進(jìn)行資源分配,即第1 個(gè)虛擬機(jī)分配主機(jī)1 資源,第2 個(gè)虛擬機(jī)分配主機(jī)2 資源等。此種分配算法優(yōu)點(diǎn)為實(shí)現(xiàn)了各主機(jī)間的負(fù)載均衡,缺點(diǎn)為各主機(jī)資源利用率未必飽滿。
最大可用資源銀行家分配算法為當(dāng)有虛擬機(jī)資源申請(qǐng)時(shí),按照可利用資源最多的主機(jī)優(yōu)先進(jìn)行分配,此種分配方法最大可能性地保障了每次分配的成功,減少了資源在同一主機(jī)上競(jìng)爭(zhēng)的可能性。
3 種分配算法如圖3 所示。圖3(a)為線性銀行家分配算法;圖3(b)為循環(huán)銀行家分配算法;圖3(c)為最大可用資源銀行家分配算法。
圖3 APCS 資源分配算法
5.2 業(yè)務(wù)連續(xù)性保障
ARP 系統(tǒng)為內(nèi)部業(yè)務(wù)管理信息處理系統(tǒng),隨著業(yè)務(wù)功能擴(kuò)展和終端業(yè)務(wù)用戶數(shù)量的不斷增多,對(duì)系統(tǒng)的業(yè)務(wù)連續(xù)性提出了越來(lái)越高的要求。APCS 私有云平臺(tái)保障了系統(tǒng)的高可用、高可靠和系統(tǒng)的災(zāi)難恢復(fù)。
通過(guò)虛擬化技術(shù)中的在線遷移功能,可以將在一臺(tái)物理主機(jī)上運(yùn)行的虛擬機(jī)實(shí)時(shí)遷移至另一臺(tái)物理主機(jī)上運(yùn)行。實(shí)現(xiàn)的技術(shù)原理為將虛擬機(jī)的文件系統(tǒng)放置在2 臺(tái)物理機(jī)都能訪問(wèn)的共享存儲(chǔ)上,遷移時(shí)只是將物理機(jī)上的計(jì)算資源進(jìn)行保護(hù),瞬間遷移至另一臺(tái)物理機(jī)上,2 臺(tái)物理機(jī)的CPU 指令集需要一致。此技術(shù)保障了一臺(tái)物理機(jī)出現(xiàn)故障,或主機(jī)負(fù)載過(guò)大影響虛擬機(jī)正常運(yùn)行時(shí),將虛擬機(jī)遷移至另一臺(tái)負(fù)載較小的主機(jī)上運(yùn)行,從而實(shí)現(xiàn)了業(yè)務(wù)系統(tǒng)高可用性。高可靠性是指應(yīng)用系統(tǒng)的物理主機(jī)出現(xiàn)故障時(shí),其應(yīng)用可以遷移至另一臺(tái)物理主機(jī)上運(yùn)行,不影響終端用戶的業(yè)務(wù)操作。以上技術(shù)保障了由于系統(tǒng)故障導(dǎo)致計(jì)劃外停機(jī)時(shí),業(yè)務(wù)系統(tǒng)的連續(xù)性應(yīng)用。同時(shí)在進(jìn)行主機(jī)硬件設(shè)備的日常檢修等計(jì)劃內(nèi)停機(jī)時(shí),也可將檢修主機(jī)上應(yīng)用手動(dòng)先遷移至其他有空閑資源的主機(jī)運(yùn)行,待檢修完畢后再遷回,從而減少對(duì)業(yè)務(wù)系統(tǒng)使用的影響。
災(zāi)難恢復(fù)是指生產(chǎn)環(huán)境遭到災(zāi)難破壞時(shí),能夠進(jìn)行數(shù)據(jù)恢復(fù)的能力,衡量指標(biāo)主要有恢復(fù)點(diǎn)目標(biāo)和恢復(fù)時(shí)間目標(biāo)。APCS 私有云平臺(tái)下由于每個(gè)虛擬機(jī)系統(tǒng)全部以文件形式存在于共享存儲(chǔ)上,因此可以對(duì)虛擬機(jī)文件進(jìn)行本地存儲(chǔ)的快照備份,然后利用存儲(chǔ)間數(shù)據(jù)同步機(jī)制將備份傳至異地災(zāi)備中心,在保證數(shù)據(jù)備份安全的同時(shí),降低系統(tǒng)恢復(fù)的RPO和RTO,從而減少系統(tǒng)恢復(fù)時(shí)間和業(yè)務(wù)數(shù)據(jù)丟失量,保障業(yè)務(wù)系統(tǒng)連續(xù)使用。
5.3 安全管理
APCS 平臺(tái)將原來(lái)分布式業(yè)務(wù)系統(tǒng)進(jìn)行區(qū)域集中后,面臨的核心安全問(wèn)題為遷移后系統(tǒng)的網(wǎng)絡(luò)安全、虛擬機(jī)安全、數(shù)據(jù)安全和訪問(wèn)控制安全等。
網(wǎng)絡(luò)層安全通過(guò)虛擬交換機(jī)的VLAN 設(shè)置和虛擬機(jī)系統(tǒng)不同的IP 網(wǎng)段分配方式進(jìn)行邏輯隔離,虛擬機(jī)間的訪問(wèn)控制通過(guò)軟件防火墻進(jìn)行設(shè)置。各區(qū)域中心節(jié)點(diǎn)AN 間通過(guò)SSLVPN 方式進(jìn)行網(wǎng)絡(luò)連接,保護(hù)數(shù)據(jù)在網(wǎng)絡(luò)傳輸層的安全性。虛擬化技術(shù)平臺(tái)對(duì)虛擬機(jī)的內(nèi)存管理、運(yùn)行保護(hù)和I/O管理提供統(tǒng)一封裝性的運(yùn)行安全管理,保障各虛擬資源間的申請(qǐng)、分配和使用安全以及對(duì)虛擬機(jī)內(nèi)處理數(shù)據(jù)的讀取、運(yùn)算和存儲(chǔ)安全。
數(shù)據(jù)安全主要包括虛擬機(jī)系統(tǒng)文件安全和虛擬機(jī)內(nèi)應(yīng)用系統(tǒng)數(shù)據(jù)安全。由于虛擬機(jī)將所有CPU、內(nèi)存、存儲(chǔ)等虛擬資源以及虛擬機(jī)上運(yùn)行的業(yè)務(wù)系統(tǒng)都統(tǒng)一封裝成固定文件格式以文件的形式存儲(chǔ)在共享存儲(chǔ)上,對(duì)這些文件的訪問(wèn)需要做到嚴(yán)格的訪問(wèn)控制管理和安全備份管理。對(duì)于虛擬機(jī)內(nèi)應(yīng)用系統(tǒng)數(shù)據(jù)安全管理方式和在系統(tǒng)在物理機(jī)上運(yùn)行時(shí)相同,采用應(yīng)用系統(tǒng)訪問(wèn)控制管理和數(shù)據(jù)庫(kù)級(jí)安全備份管理。
APCS 訪問(wèn)控制管理主要分為ACSMP 平臺(tái)管理員、虛擬機(jī)內(nèi)應(yīng)用系統(tǒng)運(yùn)維管理員和應(yīng)用系統(tǒng)業(yè)務(wù)用戶的訪問(wèn)控制管理,其控制管理辦法主要包括用戶登錄安全認(rèn)證、訪問(wèn)權(quán)限控制管理、最小特權(quán)管理以及相應(yīng)的安全審計(jì)機(jī)制等。
6 結(jié)束語(yǔ)
本文提出了一種對(duì)于分布式管理信息系統(tǒng)進(jìn)行資源整合和為最終用戶提供應(yīng)用訪問(wèn)按需分配的APCS 私有云服務(wù)解決方案。通過(guò)ACSIP 建設(shè),整合了目前分布式系統(tǒng)的硬件資源平臺(tái),提高了硬件資源的使用效率,保護(hù)了硬件投資,降低了系統(tǒng)能耗。通過(guò)ACSMP 建設(shè),實(shí)現(xiàn)了系統(tǒng)資源的統(tǒng)一調(diào)配管理,同時(shí)實(shí)現(xiàn)了系統(tǒng)的集中監(jiān)控和運(yùn)維管理,提高了系統(tǒng)運(yùn)維效率,減少了各節(jié)點(diǎn)系統(tǒng)運(yùn)維壓力,提升系統(tǒng)運(yùn)行維護(hù)管理水平。同時(shí)對(duì)私有云平臺(tái)的資源池動(dòng)態(tài)分配和分配算法、系統(tǒng)業(yè)務(wù)連續(xù)性保障、私有云安全管理等關(guān)鍵技術(shù)進(jìn)行了分析和闡述。
核心關(guān)注:拓步ERP系統(tǒng)平臺(tái)是覆蓋了眾多的業(yè)務(wù)領(lǐng)域、行業(yè)應(yīng)用,蘊(yùn)涵了豐富的ERP管理思想,集成了ERP軟件業(yè)務(wù)管理理念,功能涉及供應(yīng)鏈、成本、制造、CRM、HR等眾多業(yè)務(wù)領(lǐng)域的管理,全面涵蓋了企業(yè)關(guān)注ERP管理系統(tǒng)的核心領(lǐng)域,是眾多中小企業(yè)信息化建設(shè)首選的ERP管理軟件信賴品牌。
轉(zhuǎn)載請(qǐng)注明出處:拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/
本文標(biāo)題:基于虛擬化技術(shù)的私有云APCS平臺(tái)設(shè)計(jì)
本文網(wǎng)址:http://www.guhuozai8.cn/html/support/1112154944.html