ERP是EntERPrise Resources Planning的簡稱,即為企業資源計劃,是20世紀90年代發展起來的企業信息管理系統。ERP的內在含義是指利用計算機技術,將企業內部和外部資源信息按照成本管理原則分類整理所形成的信息管理系統。它的主要宗旨就是籽企業各方面的資源(包括人,財,物、產、供、銷等方面)充分調配和平衡,使企業在激烈的市場競爭中能夠合理地配置企業內部與外部的資源,全方位地發揮各方面的能量,從而使企業取得更好的經濟效益。ERP在我國的應用起步比較晚,取得成功的企業更是少之又少。為了加強ERP在我國企業應用的成功率,必須結合我國的實際情況,并輔之以其它先進技術。把數據倉庫和數據挖掘技術應用到ERP中,增強傳統ERP的決策功能,就是一種新的嘗試。 一、數據倉庫 什么是數據倉庫呢?一般認為,數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrated)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的數據集合,用于支持管理決策(Decision Making Support)。 一個典型的企業數據倉庫系統通常包含數據源、數據存儲與管理、OLAP服務器(建立面向聯機分析處理Online Analysis Processing,簡稱OLAP)以及前端工具與應用四個部分。 在傳統的ERP系統中,一般的核心應用都是進銷存管理和賬務管理,數據庫中的數據也是緊緊圍繞產品信息、票據和賬目明細進行的。這樣的數據層可以很好地實現OLTP(面向聯機事務處理Online Transaction Processing,簡稱OLTP),但如果要為企業高層提供決策數據的話,就有必要對這樣原始的、松散的、孤立的數據進行抽取、清洗、加上時間標記并進行合理的分類,以使之能夠進入數據倉庫并支持OLAP. 二、數據倉庫與ERP的關系 �。ㄒ唬⿺祿䝼}庫之外的EPP應用系統 ERP環境將數據提供給數據倉庫的接口與非ERP環境的接口是很相象的,但也有以下不同之處:①ERP接口只需要處理ERP所支持的DBMS技術,而非ERP接口必須處理所有的接口技術;②由于ERP供應商擁有和控制著該接口,用戶能更好地把握構成應用程序環境的數據和結構;③該接口經常需要進入到ERP環境,找到正確的數據并把它們“粘”到-起以使得這些數據在數據倉庫中是有用的。 �。ǘ┙ㄔ煸贓RP內部的數據倉庫 數據倉庫可以建造在ERP環境之中,SAP的Bw和PeopleSoft的EPM就是如此。在這種情況下,ERP產品供應商同時提供了應用程序和數據倉庫。其主要的優點是ERP供應商提供了邀個體系結構,這就節省了大量的設計工作,并且降低了設計和開發的復雜程度。簡而言之,將數據倉庫包含在ERP應用中極大地簡化了數據倉庫的設計工作。此外,這種方式還降低了長期維護的難度。 �。ㄈ┩ㄟ^ERP和非ERP系統為數據倉庫提供數據 因為將數據倉庫納入ERP應用之后,客戶就有了完整的解決方案,因此這是一種常見的選擇。然而,也存在別的選擇,一個數據倉庫可以建在ERP環境之外。同時非ERP系統也向該數據倉庫提供數據。 由于存在非ERP數據和ERP數據的集成問題,大多數企業并沒有一個完整的ERP環境。非ERP應用系統總是存在的,在這種情況下,兩種類型的數據必須要集成在一起。企業經常在構建ERP環境的同時為他們的非ERP數據建立數據倉庫。當ERP環境完成時(或至少在功能上完成時)。非ERP數據的數據倉庫也己經建立。在需要將ERP數據放入數據倉庫的時候,將ERP數據從ERP環境中取出移入數據倉庫是一件簡單的事情。 三、ERP數據倉庫設計中的關鍵技術 �。ㄒ唬⿺祿难b載 在數據裝載到數據倉庫中時首先要定義良好的數據清洗規則,保證數據的質量;其次對不同的功能要盡量做到模塊化,以提高模塊的重用性;再次,因為裝載需要經常進行,數據可能會定期進行抽取,所有要優化裝載程序,提高裝載效率;最后不同的裝載程序要在不同的時間運行, 因此要確定一個合理的數據抽取計劃。 (二)聚合 數據從ERP系統抽取到目標數據倉庫后,為了進一步提高查詢系統性能,最大限度地減少查詢響應時間,以便更好地服務與決策支持,在設計數據倉庫時,針對不同的用戶,不同的查詢要求。采用聚合設計導出了大量與聚合相對應的實體化視圖,存儲匯總數據,大大提高了易用性。但用戶的需求往往是不斷變化的,不可能預先定義所有的聚合,可以采用聚合導航器建立新的聚合。一旦新的聚合建立起來,將會通知聚合管理器,并在數據庫管理系統范圍內的匯總或全局表中注冊,使可提供給用戶查詢使用。 �。ㄈ⿺祿P� 數據倉庫的實現是從邏輯模型到物理模型的轉換過程,數據倉庫的邏輯模型主要有:星形模型和雪花模型兩種。一個簡單的星形模式由一個事實表和多個維表組成。設計的方法簡單,容易實現,但不能表示數據的多維層次結構;而雪花形模式卻彌補了星形模式的不足,對維表進行了擴展,用添加子維表的方式來表示數據的維層次,使結構清晰。在ERP系統中,很多數據集合的維具有復雜的層次結構,如時間維由屬性集合(年、季、月、星期、日)構成。ERP數據倉庫的第一層可以考慮采用星型模型,第二層可以考慮選擇雪花模型。這樣能更好地滿足不同層次的用戶的需要,表達數據的維層次結構。 �。ㄋ模┞摍C分析處理的數據清理和數據挖掘 由于訪問ERP數據倉庫的用戶分布于不同的部門和組織,主要通過Internet/Intranet訪問信息,因此OLAP采用三層結構模式。OLAP服務器用來對數據倉庫中的數據進行多維化或預綜合處理,形成多維視圖,使用戶能從多角度、多側面、多層次地分析數據,為具有明確查詢分析需求的用戶提供高性能的決策支持。 (五)數據挖掘 數據挖掘一般都是在數據倉庫的基礎上進行的,從數據倉庫中直接得到進行數據挖掘的數據有許多好處。數據倉庫的數據清理和數據挖掘的數據清理差不多,如果數據在導入數據倉庫時已經清理過,在做數據挖掘的時候就沒有必要再清理了,而且所有的數據不一致的問題都已經被解決。這樣可以提高效率,節省挖掘數據所需要的時間。由于數據倉庫的數據量大,直接在數據倉庫上進行挖掘,會影響挖掘的效率,因此數據的挖掘一般不在數據倉庫上直接進行,而是要單獨的建立數據挖掘庫。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:數據倉庫和數據挖掘在ERP的應用
本文網址:http://www.guhuozai8.cn/html/consultation/1082056537.html