大數據革命正FAApache Hadoop為中心如火如荼的進行著。自從開源分布式數據處理平臺在5年前發布時討論之聲就不絕于耳。但在過去的18個月中,Hadoop贏得了客戶的認可,并得到眾多商業化的支持以及眾多數據庫和數據集成軟件商的整合。在眾多廠商之中最著名的三個商業數據供應商當屬orack、IBM 和Microsoft。
Hadoop會在未來成為大數據的重大技術嗎?
Hadoop是一個基于Java的分布式密集數據處理和數據分析的軟件框架。Hadoop在很大程度上是受Google在2004年白皮書中闡述的MapReduce的技術啟發。MapReduce工作原理是將任務分解為成百上千塊的小任務,然后發送到計算機集群中。每臺計算機再傳送會自己那部分信息,MapReduce則迅速整合這些反饋并形成答案。
Hadoop的擴展性非常優秀,Hadoop可處理分布在數以千計的低成本x86服務器計算節點中的大型數據。同時由于眾所周知的摩爾定律,內存和磁盤的容量也在不斷增長。Hadoop對硬件的支持也在加強,現在每個節點可部署16核的處理器,12TB甚至24TB磁盤。Cloudera透露其推出的產品每個節點的成本大約4000美元。這個價格對于關系數據庫部署每TB 10000至12000美元來說極具競爭優勢。
這種高容量低成本的組合引人注目,但Hadoop最吸引人的是其處理混合數據類型的能力。
Hadoop可以管理結構化數據,以及諸如服務器日志文件和Web點擊流的數據。同時還可以管理以非結構化文本為中心的數據,如Facebook和Twitter。這種處理多類型數據能力非常重要。它催生了NoSQL平臺和產品。而傳統關系型數據庫如Oracle, IBM DB2, Microsoft SQLServer和MySQL則都不能處理混合數據類型和非結構化數據。由于事務處理靈活性的需求,Hadoop獲得大多數數據分析廠商的關注和支持。
Hadoop已被廣泛應用
現今,Hadoop已被認為是非結構化數據的專用技術。低成本、高擴展性和靈活性等優勢已成為處理大規模點擊流量分析和廣告定位等網絡巨頭(如AOL和comScore)的首選。
AOL三年多時間一直使用Hadoop。AOL的研發團隊在加利福尼亞州的Mountain View部署了300節點的系統,該系統可以存儲每天數十億事件和超過500TB的點擊流數據。點擊所帶來流數據是高度結構化的,但數據量是非常龐大和多樣的。所以幾乎不可能處理所有的提取、轉換和負載工作。AOL為了解決以上問題決定使用HadoopMapReduce處理分布在數百個計算節點的數據過濾和關聯任務。由于Hadoop為業務帶來的優勢,AOL的Hadoop研發團隊在今年四月在其總部部署了700節點的系統。
Hadoop適用于所有類型數據的特性注定將使Hadoop在更廣泛的領域使用。例如提供托管服務和中小型企業應用服務提供商SunGrad。他們將計劃推出基于云的托管服務,旨在幫助金融服務公司處理他們基于Hadoop MapReduce的數據處理。
商用軟件廠商Tidemark最近也推出一款SaaS軟件,這種基于云的性能管理應用使用MapReduce將混合數據源轉化為產品或金融規劃方案。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.guhuozai8.cn/
本文標題:Hadoop掀起大數據革命:三巨頭齊發力
本文網址:http://www.guhuozai8.cn/html/consultation/1083936031.html