
曙海教學優(yōu)勢
面向企事業(yè)單位的項目實際需要,本課程以項目實現(xiàn)為導向,秉承二十一年教學品質(zhì),授課老師將會與您分享設計的全流程以及工具的綜合使用技巧以及經(jīng)驗。您可以定制課程,線上/線下/上門都可以,報名熱線:4008699035。
二十多年來,曙海培訓的課程培養(yǎng)了大批受歡迎的工程師。曙海的課程在業(yè)內(nèi)廣受好評。大批企事業(yè)單位和曙海
建立了良好的合作關系,合作企業(yè)30萬+。
課程介紹:
通過本課程的學習,學員將深入了解到通過大規(guī)模集群的模式處理海量數(shù)據(jù)的方式與編程方法。通過實踐相關的課程內(nèi)容,使用開源的Apache?Lucene?Hadoop工具,學員將親身實踐Google文件系統(tǒng)以及Google所使用的分布式編程方式MapReduce。學員還需要完成特定的分布式應用程序設計來鞏固所學的編程知識,用于處理實際的海量數(shù)據(jù)問題。
適合對象:
·?對云計算或大規(guī)模數(shù)據(jù)處理感興趣的開發(fā)人員
·??架構師、項目經(jīng)理等
課程目標:
·?????熟悉和掌握云計算的架構與原理
·?????了解大規(guī)模數(shù)據(jù)處理的核心技術
·?????熟悉并理解企業(yè)大規(guī)模數(shù)據(jù)處理應用的注意事項
·?????對開源系統(tǒng)的應用
預備知識:
·?????對Lucene(開源的索引和檢索系統(tǒng))和??Hadoop有所理解
·?????掌握基本的Java語法
·?????對數(shù)據(jù)結(jié)構、編譯原理、概率論有基本的了解
|
第一章 |
|
|
主題 |
分布式系統(tǒng)概述 |
|
大綱 |
·?分布式系統(tǒng)基本概念 ·?分布式系統(tǒng)設計遇到的問題 ·?分布式系統(tǒng)的可靠性問題 ·?分布式系統(tǒng)的可擴展性問題 |
|
實驗: ·?實驗環(huán)境的介紹:實驗環(huán)境中所涉及到的軟件,實驗中所需要的硬件配置,編程所需要的必要的Java知識等。 ·?介紹如何在集群環(huán)境下進行Hadoop系統(tǒng)的安裝以及配置,使得每個參加的學員都能夠安裝完成Hadoop,并進行正確配置與運行。 |
|
|
第二章 |
|
|
主題 |
分布式文件系統(tǒng) |
|
大綱 |
·?傳統(tǒng)的分布式文件系統(tǒng),例如NFS,AFS等, ·?新的分布式文件系統(tǒng)的介紹,如Ceph等。 ·?介紹分布式文件系統(tǒng)GFS,以及相應的在Hadoop中的模塊HDFS。 |
|
實驗: ·?學員實驗所必須的相關的背景知識,例如多線程程序的編寫,程序的同步問題,網(wǎng)絡編程所需要的必要知識(實際是不用的,但是為了理解分布式程序的運行,必須要了解)。 ·?熟悉使用Hadoop進行編程的基礎知識:Hadoop的構成,Hadoop中相關類庫的介紹,在Hadoop環(huán)境下,使用Java操作接口,對文件系統(tǒng)進行讀寫操作。 |
|
|
第三章 |
|
|
主題 |
MapReduce編程技術 |
|
大綱 |
·?Google的MapReduce編程介紹 ·?開源軟件Nutch的體系結(jié)構與構成 ·?Hadoop的體系結(jié)構,構成以及MapReduce設計的編程要素 |
|
實驗: ·?Hadoop的MapReduce編程環(huán)境 ????使用Hadoop進行MapReduce編程,并進行第一個實驗,即做一次倒排表的實驗。 |
|
|
第四章 |
|
|
主題 |
MapReduce算法 |
|
大綱 |
·?使用MapReduce進行圖算法PageRank ·?使用MapReduce進行聚類算法Canopy?Clustering |
|
實驗: ·?圖算法PageRank的實現(xiàn) |
|
|
第五章 |
|
|
主題 |
云計算技術分析 |
|
大綱 |
·?Amazon的云計算系統(tǒng)的介紹Elastic?Computing?Cloud ·?微軟所使用的大規(guī)模數(shù)據(jù)處理技術Dryad等 ·?Google云計算平臺App?Engine深入剖析 §?App?Engine概述及其典型應用分析 §?App?Engine架構和實現(xiàn)解析 §?App?Engine應用開發(fā)接口和編程實踐 §?App?Engine與其他云計算平臺的橫向比較及展望 |
|
實驗: ·?聚類算法Canopy?Clustering的實現(xiàn) |
|
|
第六章 |
|
|
主題 |
在Google中所使用的其它技術 |
|
大綱 |
·?Google的集群的構建 ·?Google的數(shù)據(jù)庫系統(tǒng)BigTable ·?Google的分布式鎖技術Chubby |
|
實驗: ·?對實驗進行收尾工作 |
|