隨著國內水泥企業信息化建設和應用的逐步深入,各類業務系統已在企業中廣泛使用,企業內部建立了ERP系統(企業資源規劃)、CRM系統(客戶關系管理)、人力資源管理系統等基礎信息化系統。這些系統的特點是通過業務人員在客戶端對數據庫進行操作。因而在系統的實際使用中,各個部門用戶往往局限于對已有的海量數據做一些簡單的、局部的和淺層次的查詢,缺乏對相關數據信息進行深層次的分析和利用,“數據泛濫,知識貧乏”的現象很普遍,企業領導決策時,往往更多的是依靠決策者的的直覺、假設。以及各類報表的簡單。這表明企業的正確決策對數據信息有著全面和深人的客觀需求,將企業在日常事務中積累、沉淀的大量歷史數據集成為可靠的決策支持信息,已成為水泥企業關注的重要問題。
基于Pentaho的商業智能能夠充分利用水泥企業內部的各類信息系統,從業務系統的基礎數據庫中抽取需要的數據。通過對這些數據進行清洗、轉換、加載和集成,實現商業信息的搜集、管理和分析。為企業決策者提供全面、準確、系統和直觀的決策支持。
1 商業智能和Pentaho平臺
1989年,Gartner的分析師Howard Dresdner首次提出了“商業智能”(Business Intelligence,BI)的概念:它是將數據轉換成信息的過程,然后通過發現將信息轉化為知識,并將知識應用到商業行為上的一個過程。
圖1中,商業智能實質上是將數據轉化為信息的過程。這一過程也可稱為信息供應鏈,其目的是把初始的操作型數據變成決策所使用的商務信息。在這一過程中,數據集成過程執行源數據的清洗、格式轉化和合并計算等功能:數據存儲過程建立數據存儲模型,存儲企業統一的數據視圖,為商業智能系統的應用提供基礎數據:數據分析工具一般包括OLAP(聯機分析處理)、數據挖掘工具、統計分析工具及其它人工智能工具等,這些工具結合商業處理規則為決策者提供決策輔助信息。
商業智能軟件區別于一般的管理應用軟件,在決策支持中發揮重要作用,有著廣闊的市場前景,近年來在國內外受到高度重視。目前,微軟、Oracle、IBM、SAS等實力雄厚的公司都已把本身產品擴展到BI領域,其憑借雄厚的技術力量。能為大型企業提供完整的BI平臺和解決方案。然而,這些廠商提供的都是需要商業軟件授權的解決方案,國內企業在實施商業智能過程中往往需要花費高昂成本。而采用開源軟件產品,比如開源數據庫、服務器軟件等,則既有利于功能定制開發,也在授權和成本方面比商業軟件有著絕對優勢。在如今的開源BI社區,很多優秀的開源產品完全可以和商業產品一較高低。Pentaho便是目前應用比較廣泛的開源項目。
圖1 數據轉化為信息流程圖
圖2 水泥企業商業智能信息系統的體系結構
Pentaho BI平臺是一個以過程為核心,面向解決方案的、可擴展的商務智能平臺。其目的在于將一系列企業級BI產品、開源軟件、API等等組件集成起來,方便商務智能應用的開發。Pentaho的功能十分強大,它對BI的功能提供了全面支持。包括數據倉庫、ETL、OLAP、數據挖掘等技術,同時提供流程設計、報表生成、測試和部署的集成開發環境。
2 水泥企業商業智能信息系統
目前,國內大多數水泥企業都已上線ERP系統。ERP系統是指建立在信息技術基礎上,以系統化的管理思想,為企業決策層及員工提供決策運行手段的管理平臺。它將企業的物流、資金流、信息流這三大資源進行一體化集成,其管理內容涉及到企業的生產控制、物流管理和財務管理等各個方面。
通過在水泥企業原有的ERP系統基礎上構建Pentaho商業智能平臺來實現系統集成,使水泥企業不僅在一個集成的環境下,有一個合理、嚴格的流程控制,有效地完成日常的業務作業,產生大量準確的數據,同時將這些操作型數據變為分析型數據,從分析型數據中提煉決策信息。協助水泥企業決策者做出正確的決策,促進水泥企業對信息的深度利用。ERP可以為BI提供大量的準確的源數據,BI中的OLAP技術和數據挖掘技術(DM)能從數據倉庫中獲取數據并進行多目標多維度的分析,對用戶隨機性的查詢并形成報告不用消耗大量的計算機資源,消除了不必要的資源開銷。
在水泥企業ERP系統上構建Pentaho商業智能信息平臺的體系結構主要由ERP業務子系統、業務數據庫、數據轉換工具、數據倉庫、數據集市、Mondrian OLAP分析工具、Weka數據挖掘工具和決策支持子系統組成見圖2。
該集成系統將各子系統中的海量數據經過抽取、清洗、轉換、加載等過程,轉換為分析型數據,加載入數據倉庫。數據倉庫中的數據根據不同部門的實際要求,再經抽取、綜合、加載而進入不同的數據集市。成為部門經營、管理和決策的數據庫。利用OLAP和數據挖掘技術對數據倉庫或數據集市中的數據進行分析和處理。分析和處理的結果,可以直接提供給用戶,也可以作為知識進入決策支持系統的知識庫,知識庫中的知識通過推理機中的推理規則,產生推理結果,提供給管理決策者。所有的數據傳輸、前端數據展示等均采用基于Pentaho的商業智能解決方案。
3 基于Pentaho的商業智能對水泥銷售的多維分析
水泥銷售多維分析通常從時間、地區和產品的不同角度來深入觀察產品的銷售情況。這里的時間、地區和產品就是維。而這些維的不同組合和所考察的度量指標構成的多維數組則是OLAP分析的基礎,可形式化表示為(維1,維2,...,維n,度量指標),如(地區、時間、產品、銷售額)。多維分析是指對以多維形式組織起來的數據采取切片(Slice)、切塊(Dice)、鉆取(Drill-down和Roll-up)、旋轉(Pivot)等各種分析動作,以求剖析數據,使用戶能從多個角度、多側面地觀察數據庫中的數據,從而深入理解包含在數據中的信息。
水泥銷售多維分析的核心是位于服務器端的Pentaho平臺,Pentaho平臺主要由以下幾個部分組成:(1)OLAP服務器。Mondrian是純Java開發的OLAP服務器,通過該服務器。用戶可以對存儲在關系數據庫中的大型數據集進行交互分析。(2)OLAP展示工具。JPivot可視化組件,包括多維數據表和多維數據圖,可以完成數據立方體的展示。由于該組件基于JSP網頁方案,適應B/S模式開發。通過報表生成工具Report Designer,可以進一步生成專業的分析報表。(3)ETL工具。Kettle是和Pentaho整合的開源ETL工具,包括Spoon和Pan兩個包,用于定義和執行轉換操作,可以使用Chef或Kitchen讓定義的ETL任務定時自動執行。Kettle的Spoon和Chef工具有友好的圖形化界面,很容易使用。(4)數據挖掘工具。Weka是功能強大的數據挖掘軟件,提供了豐富的挖掘算法和可視化支持,適合配置緊耦合的挖掘環境。(5)集成管理和開發環境。Pentaho Design Studio,基于Eclipse的開發環境,內置的Action Sequence編輯器提供了定義工作流的圖形化界面。此外。開發人員可以很方便地利用該環境進行項目測試和部署。
表1 水泥產品銷售多維分析
圖3 水泥產品銷售多維分析柱狀圖
現已湖南某水泥企業2008年的銷售數據為基礎數據。構建基于Pentaho的商業智能解決方案。把銷售數據導入Oracle10g數據庫,作為支持Pentaho解決方案的基礎數據庫,創建處理銷售數據的Action Sequence應用,把應用部署到在Mondrian OLAP服務器上。Mondrian OLAP核心引擎根據部署的配置文件,從關系數據庫中計算和緩存數據,并響應來自表示層的各種查詢。查詢可以是MDX語句,而MDX預先存儲后,非專業用戶可以在圖形化交互界面中進行數據分析。啟動Pentaho服務器,通過Web運行得到水泥產品2008年的銷售數據多維分析和柱狀圖見表1、圖3。通過對水泥的時間、地區和產品的多維分析,可以得出水泥銷售中的地域性差別比較大的一般性結論:隨著企業歷史數據的累積。這種多維分析還將發現更多隱含的信息,可以幫助企業決策獲得更好的支持。
4 結論
通過ERP系統與商業智能的集成,構建水泥企業商業智能信息平臺,可有效利用ERP系統的海量歷史數據,通過將操作型數據轉換為分析型數據,從中提煉出決策信息,可實現水泥企業對信息的深度利用,提升決策水平�;赑entaho的商業智能解決方案,可以有針對性地實現水泥銷售的多維分析,其結果直觀、高效。Pentaho平臺部署簡單、操作簡易、運行成本低,因此易于應用并取得成效。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/