相信很多人選手機吃飯、購物、打車、

取錢沒有是手機干不了的想回家也不難

手機App上找個開鎖公司就好了

而如果選鑰匙你可能還沒出小區(qū)大門

就開始后悔了…

你還在用這種方法搭建Hadoop嗎?

手機對于今天人們生活的

重要性不言而喻

這樣的例子小編再舉一個

就是Hadoop對于大數(shù)據(jù)的重要性

你還在用這種方法搭建Hadoop嗎?

▓ 從2006年誕生至今,Hadoop已經(jīng)走過了13個年頭,成為互聯(lián)網(wǎng)行業(yè)大數(shù)據(jù)計算的標準配置。雖然時有言論唱衰Hadoop(主要針對商業(yè)發(fā)行版,而不是Hadoop技術(shù)本身),但它依然是大數(shù)據(jù)平臺的核心和事實標準。

今天,幾乎所有公司開展大數(shù)據(jù)項目都會首先引入Hadoop,然而成功卻并不容易。2016年的時候Gartner估計有60%的大數(shù)據(jù)項目遭遇失敗。這中間當然有市場、策略等在內(nèi)的很多因素,但其中一個因素很多人回過頭才發(fā)現(xiàn),是因為它們一開始就走在了“羊腸小道”上。

比如下面這個案例 

搭建標準Hadoop集群

還沒上線就出問題

IT系統(tǒng)架構(gòu)師小王供職于一家提供數(shù)據(jù)服務(wù)的A公司,該公司通過網(wǎng)絡(luò)爬蟲7×24不間斷在互聯(lián)網(wǎng)上收集所有注冊企業(yè)的公開的信息,進行數(shù)據(jù)處理和信息聚合,供其用戶進行查詢。

最近,A公司業(yè)務(wù)上有了新的創(chuàng)新,他們決定在現(xiàn)有提供查詢服務(wù)的基礎(chǔ)上,進一步對外提供數(shù)據(jù)分析服務(wù)。經(jīng)公司討論決定,這個任務(wù),落到了小王的頭上。

你還在用這種方法搭建Hadoop嗎?

借鑒互聯(lián)網(wǎng)公司的經(jīng)驗,小王最開始用標準服務(wù)器搭建標準Hadoop集群。該平臺對外提供Hadoop as a service服務(wù),每當用戶有請求,平臺都會自動幫用戶生成一套Hadoop環(huán)境,同時加載300+TB由公司提供的公共數(shù)據(jù)進去。

但是,這樣的平臺

在前期測試階段就出現(xiàn)了問題

你還在用這種方法搭建Hadoop嗎?

首先,當出現(xiàn)一個節(jié)點故障時,前端用戶使用系統(tǒng)時會感覺非常慢,極端情況下甚至出現(xiàn)過部分數(shù)據(jù)不可用,集群停止服務(wù)等問題。同時故障修復過程也非常緩慢,嚴重影響了用戶體驗。

作為一個外部服務(wù)平臺,這樣的表現(xiàn)顯然無法滿足A公司及其外部用戶SLA要求。


其次,作為一個多租戶平臺,同時要支撐很多套Hadoop集群運行,并且每套Hadoop集群都會存儲一份由A公司提供的300+TB公共數(shù)據(jù)。大量重復數(shù)據(jù)存儲造成的空間開銷異常高,直接導致需要部署的服務(wù)器數(shù)量驚人,而A公司所有IT設(shè)備均托管在運營商機房,久而久之造成機房的租用成本高企。

最后,大批量服務(wù)器部署帶來的運維成本對IT部門也是很大的負擔。

你還在用這種方法搭建Hadoop嗎?

面對這種情況

只能硬著頭皮用下去嗎?

當然不是!小編向您推薦

Isilon for Hadoop解決方案

“等等!Isilon我是知道的,它不是你們常說的那個用在影視行業(yè)很牛掰的NAS存儲嘛?它能如何幫到我??”

你還在用這種方法搭建Hadoop嗎?

不錯,Isilon確實是以NAS的形象聞名于江湖

但是它可不僅僅定位于NAS!

你還在用這種方法搭建Hadoop嗎?

Isilon由英特爾?至強?處理器提供支持,該處理器采用軟件定義的基礎(chǔ)設(shè)施和敏捷云架構(gòu),為Isilon提供了卓越的性能和效率,可加速要求嚴苛的文件工作負載,使企業(yè)發(fā)揮數(shù)據(jù)資本的價值,加速業(yè)務(wù)的數(shù)字轉(zhuǎn)型。

Isilon搭建Hadoop

大數(shù)據(jù)也能玩的溜

其實,戴爾易安信Isilon是一個成熟的數(shù)據(jù)湖解決方案,它的OneFs操作系統(tǒng)支持豐富數(shù)據(jù)訪問協(xié)議,當一種協(xié)議寫入數(shù)據(jù)湖的文件,可以馬上通過其他協(xié)議被訪問。

例如,用戶通過SMB寫入到Isilon中的文件,可以馬上通過HDFS被Hadoop計算節(jié)點訪問,省去了標準Hadoop集群繁瑣的ELT過程,而且OneFs原生支持HDFS,避免了協(xié)議轉(zhuǎn)換帶來的性能開銷。

你還在用這種方法搭建Hadoop嗎?

具體來說

用Isilon來架構(gòu)Hadoop集群

比標準Hadoop集群更具優(yōu)勢

首先,傳統(tǒng)通過DAS構(gòu)建的,是計算和存儲集中的單層架構(gòu),在擴容時需要同時擴容計算和存儲,往往會造成計算資源過剩,形成資源浪費。而通過Isilon構(gòu)建地是計算與存儲分離的二層架構(gòu)讓計算歸計算,存儲歸存儲,這樣就可以隨需靈活地擴充資源,實現(xiàn)最佳資源利用率。

你還在用這種方法搭建Hadoop嗎?

打個比方:

單層架構(gòu)好比一個人被綁住雙腳,不能走,只能跳,前行速度慢且吃力。

二層架構(gòu)好比一個人的雙腳掙脫了束縛,邁開步子往前跑,自然前進地更快。


其次,利用DAS構(gòu)建的標準Hadoop集群,需要將各類在線數(shù)據(jù)經(jīng)過繁瑣的ETL過程才能實現(xiàn)大數(shù)據(jù)分析。

你還在用這種方法搭建Hadoop嗎?

而通過Isilon構(gòu)建Hadoop集群,能夠?qū)崿F(xiàn)數(shù)據(jù)的就地分析,無需繁瑣的轉(zhuǎn)換,從而避免了協(xié)議轉(zhuǎn)換帶來的性能開銷。

你還在用這種方法搭建Hadoop嗎?

最后,就像前面小王案例中遇到的,當出現(xiàn)一個節(jié)點故障時,前端用戶就會受到顯著的影響,這就是標準DAS Hadoop無法避免的單點故障風險。

而基于Isilon搭建的Hadoop集群無單點故障,每個節(jié)點都是NameNode,能夠有效避避免業(yè)務(wù)風險。此外,Isilon的服務(wù)質(zhì)量更有保證,即使有節(jié)點失效,也不會顯著降低集群的性能。

你還在用這種方法搭建Hadoop嗎?
你還在用這種方法搭建Hadoop嗎?

具體到A公司新業(yè)務(wù)的應(yīng)用場景

總之,相較于標準架構(gòu)用服務(wù)器搭建Hadoop集群,采用Isilon方案能夠為A公司節(jié)省更多機柜空間和能耗,簡化運維管理和功能實現(xiàn)方式,并提供更可靠的數(shù)據(jù)服務(wù)和更豐富的接口支持,便于用戶進一步的業(yè)務(wù)創(chuàng)新。

你還在用這種方法搭建Hadoop嗎?

用好Hadoop不難

關(guān)鍵要走在事半功倍的道路上

分享到

崔歡歡

相關(guān)推薦