甲骨文公司副總裁兼大中華區(qū)技術(shù)總經(jīng)理喻思成
針對(duì)大數(shù)據(jù)需求而專門設(shè)計(jì)的集成化系統(tǒng)
Oracle大數(shù)據(jù)機(jī)是一款集成設(shè)計(jì)的系統(tǒng),旨在簡(jiǎn)化大數(shù)據(jù)項(xiàng)目的實(shí)施與管理。該數(shù)據(jù)機(jī)采用18臺(tái)Oracle Sun服務(wù)器的全機(jī)架式配置,總共擁有864 GB主內(nèi)存、216核CPU、648 TB原始磁盤存儲(chǔ)空間,并在節(jié)點(diǎn)和其他Oracle集成化系統(tǒng)之間采用40 Gb/s的InfiniBand網(wǎng)絡(luò)連接以及10 Gb/s的以太網(wǎng)數(shù)據(jù)中心連接,可通過InfiniBand網(wǎng)絡(luò)連接多個(gè)機(jī)架進(jìn)行橫向升級(jí)擴(kuò)展,使其能夠獲取、組織和分析超級(jí)海量的數(shù)據(jù)。
Oracle大數(shù)據(jù)機(jī)集成了Cloudera公司的Distribution Including Apache Hadoop(CDH)和Cloudera Manager軟件,還能夠快速便捷的與Oracle數(shù)據(jù)庫(kù)11g、Oracle Exadata數(shù)據(jù)庫(kù)云服務(wù)器和Oracle Exalytics商務(wù)智能云服務(wù)器集成,并通過提供企業(yè)級(jí)的應(yīng)用性能、可用性、可支持性和安全性,對(duì)所有數(shù)據(jù)類型提供極高的數(shù)據(jù)分析能力。
領(lǐng)先技術(shù),全面應(yīng)對(duì)大數(shù)據(jù)應(yīng)用挑戰(zhàn)
Oracle NoSQL數(shù)據(jù)庫(kù):為了快速、實(shí)時(shí)地捕獲所有大數(shù)據(jù),企業(yè)需要處理大數(shù)據(jù)量、低密度的信息,需要頻繁更改應(yīng)用程序,而且還必須橫向擴(kuò)展以滿足急劇擴(kuò)張的部署計(jì)劃。作為一款分布式、高度可擴(kuò)展并能夠提供關(guān)鍵價(jià)值的數(shù)據(jù)庫(kù),Oracle NoSQL數(shù)據(jù)庫(kù)專門為管理海量數(shù)據(jù)而設(shè)計(jì),可以幫助企業(yè)存取非結(jié)構(gòu)化數(shù)據(jù),并可橫向擴(kuò)展至數(shù)百個(gè)高可用性節(jié)點(diǎn)。同時(shí),該產(chǎn)品能夠提供可預(yù)測(cè)的吞吐量和延遲時(shí)間,而且更加容易安裝、配置和管理,支持廣泛的工作負(fù)載。
分析沙盒:目前,企業(yè)所面臨的挑戰(zhàn)包括擁有現(xiàn)有Oracle數(shù)據(jù)倉(cāng)庫(kù)、對(duì)大數(shù)據(jù)進(jìn)行分析、不允許對(duì)數(shù)據(jù)倉(cāng)庫(kù)SLA產(chǎn)生負(fù)面影響等。通過分析沙盒,企業(yè)可獲得分析工作區(qū),控制對(duì)資源和數(shù)據(jù)的訪問,而且完全不影響生產(chǎn)系統(tǒng)。它還可以將沙盒功能與安全、可伸縮、易于安裝的Oracle企業(yè)管理器進(jìn)行集成,從而幫助企業(yè)高效利用服務(wù)器、通過付費(fèi)方式進(jìn)行自我管理。
針對(duì)Hadoop 架構(gòu)的系統(tǒng):大數(shù)據(jù)組織和提取面臨的挑戰(zhàn)還包括將大數(shù)據(jù)轉(zhuǎn)換為易于分析的內(nèi)容、避免編寫大量 Hadoop代碼以及數(shù)據(jù)快速載入 Oracle 數(shù)據(jù)倉(cāng)庫(kù)等,Oracle大數(shù)據(jù)機(jī)中的開源Apache Hadoop、Oracle數(shù)據(jù)集成Hadoop應(yīng)用適配器、Oracle Hadoop裝載器、Oracle Direct Connector,可以幫助企業(yè)充分應(yīng)對(duì)這些挑戰(zhàn)。
Oracle數(shù)據(jù)集成Hadoop應(yīng)用適配器通過Oracle數(shù)據(jù)集成器易于使用的界面,自動(dòng)生成Hadoop MapReduce代碼,簡(jiǎn)化了Hadoop應(yīng)用與Oracle數(shù)據(jù)庫(kù)的數(shù)據(jù)集成。Oracle Hadoop裝載器使客戶能夠利用Hadoop MapReduce處理功能建立優(yōu)化的數(shù)據(jù)集,從而在Oracle數(shù)據(jù)庫(kù)11g中進(jìn)行高效率加載和分析。Oracle Direct Connector可通過SQL語(yǔ)言從Oracle數(shù)據(jù)庫(kù)直接訪問Hadoop分布式文件系統(tǒng)上的數(shù)據(jù)。
R語(yǔ)言:在分析大數(shù)據(jù)時(shí),企業(yè)需要訪問所有數(shù)據(jù),使用R語(yǔ)言進(jìn)行統(tǒng)計(jì)分析,但通過便攜機(jī)進(jìn)行分析速度較慢且不安全。甲骨文提供的Oracle R Enterprise實(shí)現(xiàn)了R開源統(tǒng)計(jì)環(huán)境與Oracle數(shù)據(jù)庫(kù)11g的集成,分析師和統(tǒng)計(jì)人員可以運(yùn)行現(xiàn)有的R應(yīng)用,并利用R客戶端直接處理存儲(chǔ)在Oracle數(shù)據(jù)庫(kù)11g中的數(shù)據(jù),從而極大地提高可擴(kuò)展性、性能和安全性。Oracle數(shù)據(jù)庫(kù)11g與R開源統(tǒng)計(jì)環(huán)境的整合為進(jìn)行更進(jìn)一步的數(shù)據(jù)分析提供了一個(gè)企業(yè)就緒的、深度集成的環(huán)境。
加快決策,最大限度地挖掘大數(shù)據(jù)的商業(yè)價(jià)值
通過Oracle大數(shù)據(jù)機(jī)快速獲得、組織大數(shù)據(jù)之后,企業(yè)還需要根據(jù)對(duì)大數(shù)據(jù)全面實(shí)時(shí)的分析做出最恰當(dāng)?shù)臉I(yè)務(wù)決策。作為業(yè)界首款集成設(shè)計(jì)的內(nèi)存硬件與軟件系統(tǒng),Oracle Exalytics商務(wù)智能云服務(wù)器能夠以前所未有的速度運(yùn)行數(shù)據(jù)分析應(yīng)用,為客戶提供實(shí)時(shí)的、快速的可視分析。Oracle Exalytics實(shí)現(xiàn)了新型分析應(yīng)用,可用于異構(gòu)IT環(huán)境,并能存取和分析來自任何Oracle或非Oracle的關(guān)系型、OLAP或非結(jié)構(gòu)化數(shù)據(jù)源的數(shù)據(jù)。
憑借在軟硬件雙方面的創(chuàng)新,Oracle Exalytics商務(wù)智能云服務(wù)器實(shí)現(xiàn)極致數(shù)據(jù)分析性能,其亞秒級(jí)性能可以支持快速的數(shù)據(jù)分析,還能提供建模、規(guī)劃、預(yù)測(cè)和預(yù)測(cè)性分析,同時(shí)使企業(yè)規(guī)劃應(yīng)用能夠以更快的、更準(zhǔn)確的規(guī)劃周期在整個(gè)企業(yè)內(nèi)擴(kuò)展,可有效幫助企業(yè)加快業(yè)務(wù)決策,最大限度地挖掘大數(shù)據(jù)的商業(yè)價(jià)值。
喻思成總結(jié)道:“通過整體設(shè)計(jì)、測(cè)試、部署、管理和升級(jí)支持,Oracle大數(shù)據(jù)產(chǎn)品,可橫跨IT架構(gòu)的所有層面與其他產(chǎn)品進(jìn)行創(chuàng)新集成,進(jìn)一步幫助客戶獲得卓越的數(shù)據(jù)獲取、組織和分析性能,同時(shí)為其提供更好的業(yè)務(wù)決策,實(shí)現(xiàn)更高的可靠性、可擴(kuò)展性、安全性和可管理性。Oracle大數(shù)據(jù)解決方案是未來企業(yè)構(gòu)建云計(jì)算基礎(chǔ)架構(gòu)及應(yīng)對(duì)大數(shù)據(jù)挑戰(zhàn)的理想選擇?!?/p>