
曙海教學(xué)優(yōu)勢
該課程,秉承21年教學(xué)品質(zhì),以項(xiàng)目實(shí)現(xiàn)為導(dǎo)向,面向企事業(yè)單位項(xiàng)目實(shí)際需求,講師將會與您分享設(shè)計(jì)的全流程以及工具的綜合使用技巧與經(jīng)驗(yàn)。課程可定制,線下/線上/上門皆可,全國免費(fèi)報(bào)名熱線:4008699035。
曙海培訓(xùn)的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。大批企業(yè)和曙海
建立了良好的合作關(guān)系,合作企業(yè)三十多萬家。曙海的課程得到業(yè)內(nèi)企事業(yè)單位廣泛贊譽(yù)。
課程目標(biāo):
1、?深入理解Hadoop實(shí)現(xiàn)原理和架構(gòu)
2、?Hadoop系統(tǒng)安裝、配置、運(yùn)維
3、?大型Hadoop項(xiàng)目的開發(fā)、運(yùn)行、調(diào)試、優(yōu)化
4、?HBase、Hive、Pig、Oozie、ZooKeeper等相關(guān)項(xiàng)目使用和開發(fā)
課程大綱:
1、?Hadoop簡介
a)?什么是大數(shù)據(jù)
b)?傳統(tǒng)的并行計(jì)算和分布式計(jì)算
c)?Hadoop的誕生
d)?Hadoop的特點(diǎn)
2、?HDFS分布式文件系統(tǒng)管理
a)?HDFS設(shè)計(jì)目標(biāo)
b)?HDFS工作原理
c)?HDFS命令行工具介紹
d)?HDFS系統(tǒng)及硬件推薦配置
e)?HDFS安裝
f)?HDFS參數(shù)設(shè)置推薦
g)?HDFS配置參數(shù)具體介紹
3、?HDFS分布式文件系統(tǒng)開發(fā)
a)?Eclipse?開發(fā)環(huán)境
b)?Java?API?詳解
c)?練習(xí)
4、?Map/Reduce分布式運(yùn)算框架管理
a)?為什么需要M/R
b)?M/R的工作機(jī)制
c)?M/R相關(guān)的系統(tǒng)服務(wù)
d)?M/R參數(shù)配置
e)?M/R啟動、停止、查看日志
f)?M/R任務(wù)調(diào)度策略
5、?Map/Reduce分布式運(yùn)算框架開發(fā)
a)?M/R程序的框架及接口詳解
b)?M/R的輸入輸出
c)?運(yùn)行M/R程序
d)?練習(xí)
6、?HBase分布式數(shù)據(jù)庫管理及開發(fā)
a)?NoSQL介紹
b)?什么是HBase、為什么使用HBase
c)?HBase與關(guān)系型數(shù)據(jù)庫的對比
d)?HBase架構(gòu)、服務(wù)、存儲結(jié)構(gòu)
e)?表、列簇、分區(qū)
f)?HBase安裝、配置、啟動、日志
g)?HBase的Java?API:CRUD、M/R、Filter
h)?練習(xí)
i)?HBase高級特性:Coprocessor、性能優(yōu)化
j)?練習(xí)
k)?Schema設(shè)計(jì)要點(diǎn)
7、?Hive數(shù)據(jù)倉庫使用與開發(fā)
a)?Hive的使用場景
b)?Hive的安裝與配置
c)?Hive?QL詳解
d)?UDF與UDAF的編寫
e)?練習(xí)
8、?Pig腳本的使用與開發(fā)
a)?Pig的使用場景
b)?Pig的安裝與配置
c)?Pig?Latin語言詳解
d)?用戶函數(shù)以及運(yùn)行模式
9、?Oozie工作流引擎
a)?Oozie的使用場景
b)?工作流的定義
c)?流程XML原語
d)?練習(xí)
10、?Hadoop系統(tǒng)監(jiān)控與運(yùn)維:Ganglia集成
11、?Storm流計(jì)算框架簡介
12、?ZooKeeper分布式調(diào)度系統(tǒng)的原理、架構(gòu)、特性、配置、API
13、?Sqoop數(shù)據(jù)庫集成框架簡介
14、?Flume數(shù)據(jù)流采集系統(tǒng)簡介
15、?Mahout、Redis、Lucene/Solr簡介