男主养女主到十六岁要了她_亚洲一线二线三线suv_欧美人禽性动交异族另类_777久久人妻少妇嫩草av_超级yin荡的高中女h文校园_国产999精品久久久久久_99精产国品一二三产区区别_乱伦综合免费精品_日韩欧美~中文字幕黄

  • 全國 [切換]
  • 億企商貿(mào)

    掃一掃關(guān)注

    一篇文看懂Hadoop:風(fēng)雨十年,未來何去何從

       2016-06-25 2330
    導(dǎo)讀

    我們很榮幸能夠見證Hadoop十年從無到有,再到稱王。感動于技術(shù)的日新月異時,希望通過這篇內(nèi)容深入解讀Hadoop的昨天、今天和明天

     我們很榮幸能夠見證Hadoop十年從無到有,再到稱王。感動于技術(shù)的日新月異時,希望通過這篇內(nèi)容深入解讀Hadoop的昨天、今天和明天,憧憬下一個十年。

    本文分為技術(shù)篇、產(chǎn)業(yè)篇、應(yīng)用篇、展望篇四部分

    技術(shù)篇

    一篇文看懂Hadoop:風(fēng)雨十年,未來何去何從

    2006年項目成立的一開始,“Hadoop”這個單詞只代表了兩個組件——HDFS和MapReduce。到現(xiàn)在的10個年頭,這個單詞代表的是“核心”(即Core Hadoop項目)以及與之相關(guān)的一個不斷成長的生態(tài)系統(tǒng)。這個和Linux非常類似,都是由一個核心和一個生態(tài)系統(tǒng)組成。

    現(xiàn)在Hadoop在一月發(fā)布了2.7.2的穩(wěn)定版, 已經(jīng)從 傳統(tǒng)的Hadoop三駕馬車HDFS,MapReduce和Hbase社區(qū)發(fā)展為60多個相關(guān)組件組成的龐大生態(tài) ,其中包含在各大發(fā)行版中的組件就有25個以上,包括數(shù)據(jù)存儲、執(zhí)行引擎、編程和數(shù)據(jù)訪問框架等。

    Hadoop在2.0將資源管理從MapReduce中獨(dú)立出來變成通用框架后,就從1.0的三層結(jié)構(gòu)演變?yōu)榱爽F(xiàn)在的四層架構(gòu):

    底層——存儲層,文件系統(tǒng)HDFS

    中間層——資源及數(shù)據(jù)管理層,YARN以及Sentry等

    上層——MapReduce、Impala、Spark等計算引擎

    頂層——基于MapReduce、Spark等計算引擎的高級封裝及工具,如Hive、Pig、Mahout等等

    一篇文看懂Hadoop:風(fēng)雨十年,未來何去何從

    存儲層

    HDFS已經(jīng)成為了大數(shù)據(jù)磁盤存儲的事實(shí)標(biāo)準(zhǔn),用于海量日志類大文件的在線存儲。經(jīng)過這些年的發(fā)展,HDFS的架構(gòu)和功能基本固化,像HA、異構(gòu)存儲、本地數(shù)據(jù)短路訪問等重要特性已經(jīng)實(shí)現(xiàn),在路線圖中除了Erasure Code已經(jīng)沒什么讓人興奮的feature。

    隨著HDFS越來越穩(wěn)定,社區(qū)的活躍度也越來越低,同時HDFS的使用場景也變得成熟和固定,而上層會有越來越多的文件格式封裝:列式存儲的文件格式,如Parquent,很好的解決了現(xiàn)有BI類數(shù)據(jù)分析場景;以后還會出現(xiàn)新的存儲格式來適應(yīng)更多的應(yīng)用場景,如數(shù)組存儲來服務(wù)機(jī)器學(xué)習(xí)類應(yīng)用等。未來HDFS會繼續(xù)擴(kuò)展對于新興存儲介質(zhì)和服務(wù)器架構(gòu)的支持。

    2015年Hbase 發(fā)布了1.0版本,這也代表著 Hbase 走向了穩(wěn)定。最新Hbase新增特性包括:更加清晰的接口定義,多Region 副本以支持高可用讀,F(xiàn)amily粒度的Flush以及RPC讀寫隊列分離等。未來Hbase不會再添加大的新功能,而將會更多的在穩(wěn)定性和性能方面進(jìn)化,尤其是大內(nèi)存支持、內(nèi)存GC效率等。

    Kudu是Cloudera在2015年10月才對外公布的新的分布式存儲架構(gòu),與HDFS完全獨(dú)立。其實(shí)現(xiàn)參考了2012年Google發(fā)表的Spanner論文。鑒于Spanner在Google 內(nèi)部的巨大成功,Kudu被譽(yù)為下一代分析平臺的重要組成,用于處理快速數(shù)據(jù)的查詢和分析,填補(bǔ)HDFS和Hbase之間的空白。其出現(xiàn)將進(jìn)一步把Hadoop市場向傳統(tǒng)數(shù)據(jù)倉庫市場靠攏。

    Apache Arrow項目為列式內(nèi)存存儲的處理和交互提供了規(guī)范。目前來自Apache Hadoop社區(qū)的開發(fā)者們致力于將它制定為大數(shù)據(jù)系統(tǒng)項目的事實(shí)性標(biāo)準(zhǔn)。

    一篇文看懂Hadoop:風(fēng)雨十年,未來何去何從

    Arrow項目受到了Cloudera、Databricks等多個大數(shù)據(jù)巨頭公司支持,很多committer同時也是其他明星大數(shù)據(jù)項目(如Hbase、Spark、Kudu等)的核心開發(fā)人員。再考慮到Tachyon等似乎還沒有找到太多實(shí)際接地氣的應(yīng)用場景,Arrow的高調(diào)出場可能會成為未來新的內(nèi)存分析文件接口標(biāo)準(zhǔn)。

     
    (文/小編)
     
    反對 0 舉報 0 收藏 0 打賞 0 評論 0
    0相關(guān)評論
    免責(zé)聲明
    本文為小編原創(chuàng)作品,作者: 小編。歡迎轉(zhuǎn)載,轉(zhuǎn)載請注明原文出處:http://www.bjhmdhb.com/news/show-19449.html 。本文僅代表作者個人觀點(diǎn),本站未對其內(nèi)容進(jìn)行核實(shí),請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,作者需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請及時聯(lián)系我們。
     

    2B SYSTEM All Rights Reserved 本平臺由浙江到門口科技有限公司運(yùn)營與監(jiān)管

    浙ICP備17023505號-1公網(wǎng)安備浙公網(wǎng)安備33100402331026號號