
曙海教學(xué)優(yōu)勢(shì)
該課程,秉承21年教學(xué)品質(zhì),以項(xiàng)目實(shí)現(xiàn)為導(dǎo)向,面向企事業(yè)單位項(xiàng)目實(shí)際需求,講師將會(huì)與您分享設(shè)計(jì)的全流程以及工具的綜合使用技巧與經(jīng)驗(yàn)。課程可定制,線下/線上/上門(mén)皆可,全國(guó)免費(fèi)報(bào)名熱線:4008699035。
曙海培訓(xùn)的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。大批企業(yè)和曙海
建立了良好的合作關(guān)系,合作企業(yè)三十多萬(wàn)家。曙海的課程得到業(yè)內(nèi)企事業(yè)單位廣泛贊譽(yù)。
?課程目標(biāo):
1)知道Spark能做什么,不能做什么。
2)hadoop和Spark的適用場(chǎng)景。
3)能過(guò)熟知Spark的原理、安裝Spark集群。
4)能夠獨(dú)立使用Spark工具來(lái)分析海量數(shù)據(jù)。
5)會(huì)使用shark來(lái)分析數(shù)據(jù)。
6)會(huì)使用Spark Streaming來(lái)處理數(shù)據(jù)。
7)一個(gè)需求過(guò)來(lái)知道在Spark上面怎么實(shí)現(xiàn)。
培訓(xùn)內(nèi)容:
|
·?Scala語(yǔ)言介紹 ·?Scala語(yǔ)言安裝 ·?Scala快速入門(mén)介紹 ·?什么Spark ·?Spark的簡(jiǎn)介 ·?Spark的編譯 ·?Spark的安裝 Spark安裝成功測(cè)試 |
|
·?Spark原理 ·?Spark的RDD ·?什么是RDD ·?RDD的種類? o?Tranformation o?Action ·?Spark的存儲(chǔ)級(jí)別 ·?Cache介紹 ·?Spark的容錯(cuò)原理 ·?Lineage容錯(cuò) ·?Checkpoint容錯(cuò) ·?RDD的創(chuàng)建 ·?案例? 統(tǒng)計(jì)單詞的個(gè)數(shù) |
|
·?Spark調(diào)度組件 ·?RDD?graph ·?作業(yè)與任務(wù)調(diào)度 ·?DAG?Scheduler ·?Task?Scheduler ·?Task細(xì)節(jié) ·?Job的調(diào)度流程 ·?Broadcast?variables介紹 ·?Spark的優(yōu)化 ·?Spark的生態(tài)系統(tǒng)? o?Shark o?Streaming ·?Spark與hadoop的比較 Spark的使用場(chǎng)景介紹 |
|
·?Spark實(shí)戰(zhàn)一:求最大值 ·?Spark實(shí)戰(zhàn)二:自定義RDD(define?a?new?RDD) ·?Spark實(shí)戰(zhàn)三:RDD創(chuàng)建的種類(Scala、HDFS、localdisk?and?inputformat) Spark實(shí)戰(zhàn)四:基于Spark的日志分析 |
?
?