隨著國內(nèi)水泥企業(yè)信息化建設(shè)和應用的逐步深入,各類業(yè)務(wù)系統(tǒng)已在企業(yè)中廣泛使用,企業(yè)內(nèi)部建立了ERP系統(tǒng)(企業(yè)資源規(guī)劃)、CRM系統(tǒng)(客戶關(guān)系管理)、人力資源管理系統(tǒng)等基礎(chǔ)信息化系統(tǒng)。這些系統(tǒng)的特點是通過業(yè)務(wù)人員在客戶端對數(shù)據(jù)庫進行操作。因而在系統(tǒng)的實際使用中,各個部門用戶往往局限于對已有的海量數(shù)據(jù)做一些簡單的、局部的和淺層次的查詢,缺乏對相關(guān)數(shù)據(jù)信息進行深層次的分析和利用,“數(shù)據(jù)泛濫,知識貧乏”的現(xiàn)象很普遍,企業(yè)領(lǐng)導決策時,往往更多的是依靠決策者的的直覺、假設(shè)。以及各類報表的簡單。這表明企業(yè)的正確決策對數(shù)據(jù)信息有著全面和深人的客觀需求,將企業(yè)在日常事務(wù)中積累、沉淀的大量歷史數(shù)據(jù)集成為可靠的決策支持信息,已成為水泥企業(yè)關(guān)注的重要問題。
基于Pentaho的商業(yè)智能能夠充分利用水泥企業(yè)內(nèi)部的各類信息系統(tǒng),從業(yè)務(wù)系統(tǒng)的基礎(chǔ)數(shù)據(jù)庫中抽取需要的數(shù)據(jù)。通過對這些數(shù)據(jù)進行清洗、轉(zhuǎn)換、加載和集成,實現(xiàn)商業(yè)信息的搜集、管理和分析。為企業(yè)決策者提供全面、準確、系統(tǒng)和直觀的決策支持。
1 商業(yè)智能和Pentaho平臺
1989年,Gartner的分析師Howard Dresdner首次提出了“商業(yè)智能”(Business Intelligence,BI)的概念:它是將數(shù)據(jù)轉(zhuǎn)換成信息的過程,然后通過發(fā)現(xiàn)將信息轉(zhuǎn)化為知識,并將知識應用到商業(yè)行為上的一個過程。
圖1中,商業(yè)智能實質(zhì)上是將數(shù)據(jù)轉(zhuǎn)化為信息的過程。這一過程也可稱為信息供應鏈,其目的是把初始的操作型數(shù)據(jù)變成決策所使用的商務(wù)信息。在這一過程中,數(shù)據(jù)集成過程執(zhí)行源數(shù)據(jù)的清洗、格式轉(zhuǎn)化和合并計算等功能:數(shù)據(jù)存儲過程建立數(shù)據(jù)存儲模型,存儲企業(yè)統(tǒng)一的數(shù)據(jù)視圖,為商業(yè)智能系統(tǒng)的應用提供基礎(chǔ)數(shù)據(jù):數(shù)據(jù)分析工具一般包括OLAP(聯(lián)機分析處理)、數(shù)據(jù)挖掘工具、統(tǒng)計分析工具及其它人工智能工具等,這些工具結(jié)合商業(yè)處理規(guī)則為決策者提供決策輔助信息。
商業(yè)智能軟件區(qū)別于一般的管理應用軟件,在決策支持中發(fā)揮重要作用,有著廣闊的市場前景,近年來在國內(nèi)外受到高度重視。目前,微軟、Oracle、IBM、SAS等實力雄厚的公司都已把本身產(chǎn)品擴展到BI領(lǐng)域,其憑借雄厚的技術(shù)力量。能為大型企業(yè)提供完整的BI平臺和解決方案。然而,這些廠商提供的都是需要商業(yè)軟件授權(quán)的解決方案,國內(nèi)企業(yè)在實施商業(yè)智能過程中往往需要花費高昂成本。而采用開源軟件產(chǎn)品,比如開源數(shù)據(jù)庫、服務(wù)器軟件等,則既有利于功能定制開發(fā),也在授權(quán)和成本方面比商業(yè)軟件有著絕對優(yōu)勢。在如今的開源BI社區(qū),很多優(yōu)秀的開源產(chǎn)品完全可以和商業(yè)產(chǎn)品一較高低。Pentaho便是目前應用比較廣泛的開源項目。
圖1 數(shù)據(jù)轉(zhuǎn)化為信息流程圖
圖2 水泥企業(yè)商業(yè)智能信息系統(tǒng)的體系結(jié)構(gòu)
Pentaho BI平臺是一個以過程為核心,面向解決方案的、可擴展的商務(wù)智能平臺。其目的在于將一系列企業(yè)級BI產(chǎn)品、開源軟件、API等等組件集成起來,方便商務(wù)智能應用的開發(fā)。Pentaho的功能十分強大,它對BI的功能提供了全面支持。包括數(shù)據(jù)倉庫、ETL、OLAP、數(shù)據(jù)挖掘等技術(shù),同時提供流程設(shè)計、報表生成、測試和部署的集成開發(fā)環(huán)境。
2 水泥企業(yè)商業(yè)智能信息系統(tǒng)
目前,國內(nèi)大多數(shù)水泥企業(yè)都已上線ERP系統(tǒng)。ERP系統(tǒng)是指建立在信息技術(shù)基礎(chǔ)上,以系統(tǒng)化的管理思想,為企業(yè)決策層及員工提供決策運行手段的管理平臺。它將企業(yè)的物流、資金流、信息流這三大資源進行一體化集成,其管理內(nèi)容涉及到企業(yè)的生產(chǎn)控制、物流管理和財務(wù)管理等各個方面。
通過在水泥企業(yè)原有的ERP系統(tǒng)基礎(chǔ)上構(gòu)建Pentaho商業(yè)智能平臺來實現(xiàn)系統(tǒng)集成,使水泥企業(yè)不僅在一個集成的環(huán)境下,有一個合理、嚴格的流程控制,有效地完成日常的業(yè)務(wù)作業(yè),產(chǎn)生大量準確的數(shù)據(jù),同時將這些操作型數(shù)據(jù)變?yōu)榉治鲂蛿?shù)據(jù),從分析型數(shù)據(jù)中提煉決策信息。協(xié)助水泥企業(yè)決策者做出正確的決策,促進水泥企業(yè)對信息的深度利用。ERP可以為BI提供大量的準確的源數(shù)據(jù),BI中的OLAP技術(shù)和數(shù)據(jù)挖掘技術(shù)(DM)能從數(shù)據(jù)倉庫中獲取數(shù)據(jù)并進行多目標多維度的分析,對用戶隨機性的查詢并形成報告不用消耗大量的計算機資源,消除了不必要的資源開銷。
在水泥企業(yè)ERP系統(tǒng)上構(gòu)建Pentaho商業(yè)智能信息平臺的體系結(jié)構(gòu)主要由ERP業(yè)務(wù)子系統(tǒng)、業(yè)務(wù)數(shù)據(jù)庫、數(shù)據(jù)轉(zhuǎn)換工具、數(shù)據(jù)倉庫、數(shù)據(jù)集市、Mondrian OLAP分析工具、Weka數(shù)據(jù)挖掘工具和決策支持子系統(tǒng)組成見圖2。
該集成系統(tǒng)將各子系統(tǒng)中的海量數(shù)據(jù)經(jīng)過抽取、清洗、轉(zhuǎn)換、加載等過程,轉(zhuǎn)換為分析型數(shù)據(jù),加載入數(shù)據(jù)倉庫。數(shù)據(jù)倉庫中的數(shù)據(jù)根據(jù)不同部門的實際要求,再經(jīng)抽取、綜合、加載而進入不同的數(shù)據(jù)集市。成為部門經(jīng)營、管理和決策的數(shù)據(jù)庫。利用OLAP和數(shù)據(jù)挖掘技術(shù)對數(shù)據(jù)倉庫或數(shù)據(jù)集市中的數(shù)據(jù)進行分析和處理。分析和處理的結(jié)果,可以直接提供給用戶,也可以作為知識進入決策支持系統(tǒng)的知識庫,知識庫中的知識通過推理機中的推理規(guī)則,產(chǎn)生推理結(jié)果,提供給管理決策者。所有的數(shù)據(jù)傳輸、前端數(shù)據(jù)展示等均采用基于Pentaho的商業(yè)智能解決方案。
3 基于Pentaho的商業(yè)智能對水泥銷售的多維分析
水泥銷售多維分析通常從時間、地區(qū)和產(chǎn)品的不同角度來深入觀察產(chǎn)品的銷售情況。這里的時間、地區(qū)和產(chǎn)品就是維。而這些維的不同組合和所考察的度量指標構(gòu)成的多維數(shù)組則是OLAP分析的基礎(chǔ),可形式化表示為(維1,維2,...,維n,度量指標),如(地區(qū)、時間、產(chǎn)品、銷售額)。多維分析是指對以多維形式組織起來的數(shù)據(jù)采取切片(Slice)、切塊(Dice)、鉆取(Drill-down和Roll-up)、旋轉(zhuǎn)(Pivot)等各種分析動作,以求剖析數(shù)據(jù),使用戶能從多個角度、多側(cè)面地觀察數(shù)據(jù)庫中的數(shù)據(jù),從而深入理解包含在數(shù)據(jù)中的信息。
水泥銷售多維分析的核心是位于服務(wù)器端的Pentaho平臺,Pentaho平臺主要由以下幾個部分組成:(1)OLAP服務(wù)器。Mondrian是純Java開發(fā)的OLAP服務(wù)器,通過該服務(wù)器。用戶可以對存儲在關(guān)系數(shù)據(jù)庫中的大型數(shù)據(jù)集進行交互分析。(2)OLAP展示工具。JPivot可視化組件,包括多維數(shù)據(jù)表和多維數(shù)據(jù)圖,可以完成數(shù)據(jù)立方體的展示。由于該組件基于JSP網(wǎng)頁方案,適應B/S模式開發(fā)。通過報表生成工具Report Designer,可以進一步生成專業(yè)的分析報表。(3)ETL工具。Kettle是和Pentaho整合的開源ETL工具,包括Spoon和Pan兩個包,用于定義和執(zhí)行轉(zhuǎn)換操作,可以使用Chef或Kitchen讓定義的ETL任務(wù)定時自動執(zhí)行。Kettle的Spoon和Chef工具有友好的圖形化界面,很容易使用。(4)數(shù)據(jù)挖掘工具。Weka是功能強大的數(shù)據(jù)挖掘軟件,提供了豐富的挖掘算法和可視化支持,適合配置緊耦合的挖掘環(huán)境。(5)集成管理和開發(fā)環(huán)境。Pentaho Design Studio,基于Eclipse的開發(fā)環(huán)境,內(nèi)置的Action Sequence編輯器提供了定義工作流的圖形化界面。此外。開發(fā)人員可以很方便地利用該環(huán)境進行項目測試和部署。
表1 水泥產(chǎn)品銷售多維分析
圖3 水泥產(chǎn)品銷售多維分析柱狀圖
現(xiàn)已湖南某水泥企業(yè)2008年的銷售數(shù)據(jù)為基礎(chǔ)數(shù)據(jù)。構(gòu)建基于Pentaho的商業(yè)智能解決方案。把銷售數(shù)據(jù)導入Oracle10g數(shù)據(jù)庫,作為支持Pentaho解決方案的基礎(chǔ)數(shù)據(jù)庫,創(chuàng)建處理銷售數(shù)據(jù)的Action Sequence應用,把應用部署到在Mondrian OLAP服務(wù)器上。Mondrian OLAP核心引擎根據(jù)部署的配置文件,從關(guān)系數(shù)據(jù)庫中計算和緩存數(shù)據(jù),并響應來自表示層的各種查詢。查詢可以是MDX語句,而MDX預先存儲后,非專業(yè)用戶可以在圖形化交互界面中進行數(shù)據(jù)分析。啟動Pentaho服務(wù)器,通過Web運行得到水泥產(chǎn)品2008年的銷售數(shù)據(jù)多維分析和柱狀圖見表1、圖3。通過對水泥的時間、地區(qū)和產(chǎn)品的多維分析,可以得出水泥銷售中的地域性差別比較大的一般性結(jié)論:隨著企業(yè)歷史數(shù)據(jù)的累積。這種多維分析還將發(fā)現(xiàn)更多隱含的信息,可以幫助企業(yè)決策獲得更好的支持。
4 結(jié)論
通過ERP系統(tǒng)與商業(yè)智能的集成,構(gòu)建水泥企業(yè)商業(yè)智能信息平臺,可有效利用ERP系統(tǒng)的海量歷史數(shù)據(jù),通過將操作型數(shù)據(jù)轉(zhuǎn)換為分析型數(shù)據(jù),從中提煉出決策信息,可實現(xiàn)水泥企業(yè)對信息的深度利用,提升決策水平。基于Pentaho的商業(yè)智能解決方案,可以有針對性地實現(xiàn)水泥銷售的多維分析,其結(jié)果直觀、高效。Pentaho平臺部署簡單、操作簡易、運行成本低,因此易于應用并取得成效。
轉(zhuǎn)載請注明出處:拓步ERP資訊網(wǎng)http://www.guhuozai8.cn/
本文標題:基于Pentaho的水泥企業(yè)商業(yè)智能信息系統(tǒng)開發(fā)
本文網(wǎng)址:http://www.guhuozai8.cn/html/solutions/1401934882.html