
曙海教學(xué)優(yōu)勢
面向企事業(yè)單位的項目實際需要,本課程以項目實現(xiàn)為導(dǎo)向,秉承二十一年教學(xué)品質(zhì),授課老師將會與您分享設(shè)計的全流程以及工具的綜合使用技巧以及經(jīng)驗。您可以定制課程,線上/線下/上門都可以,報名熱線:4008699035。
二十多年來,曙海培訓(xùn)的課程培養(yǎng)了大批受歡迎的工程師。曙海的課程在業(yè)內(nèi)廣受好評。大批企事業(yè)單位和曙海
建立了良好的合作關(guān)系,合作企業(yè)30萬+。
?Spark培訓(xùn)——提高云計算大數(shù)據(jù)速度
培訓(xùn)內(nèi)容:
第一部分:
1、Spark的架構(gòu)設(shè)計
1.1?Spark的速度為什么如此的快?
1.2?Spark的架構(gòu)設(shè)計剖析
1.3?RDD計算流程解析
1.4?Spark的出色容錯機(jī)制
2、實戰(zhàn)使用三種語言開發(fā)Spark
2.1?Scala簡介、為什么Spark會使用Scala作為開發(fā)語言?
2.2?在Spark中使用Scala
2.3?使用Java開發(fā)Spark程序
2.4?使用Python開發(fā)Spark程序
2.5?深入使用Spark?Shell
3、快速掌握Scala
3.1?Scala變量聲明、操作符、函數(shù)的使用實戰(zhàn)
3.2?apply方法
3.3?Scal的控制結(jié)構(gòu)和函數(shù)
3.4?Scala數(shù)組的操作、Map的操作
3.5?Scala中的類
3.6?Scala中對象的使用;
3.7?Scala中的繼承
3.8?Scala中的特質(zhì)
3.9?Scala中集合操作
4、Spark集群的安裝和設(shè)置
4.1?在一臺機(jī)器上運(yùn)行Spark
4.2?在EC2上運(yùn)行Spark
4.3?在Mesos上部署Spark
4.4?在YARN上部署Spark
4.5?通過SSH在眾多機(jī)器上部署Spark
4.6?Spark集群設(shè)置
5、編寫Spark程序
5.1?程序數(shù)據(jù)的來源:File、HDFS、HBase、S3等
5.2?IDE環(huán)境構(gòu)建
5.3?Maven
5.4?sbt.
5.5?編寫并部署Spark程序的實例
第二部分
6、SparkContext解析和數(shù)據(jù)加載以及存儲
6.1?源碼剖析SparkContext
6.2?Scala、Java、Python使用SparkContext
6.4?加載數(shù)據(jù)成為RDD
6.5?把數(shù)據(jù)物化
7、深入實戰(zhàn)RDD
7.1?DAG
7.2?深入實戰(zhàn)各種Scala?RDD?Function?
7.3?Spark?Java?RDD?Function
7.4?RDD的優(yōu)化問題
8、Shark的原理和使用
8.1?Shark與Hive
8.2?安裝和配置Shark
8.3?使用Shark處理數(shù)據(jù)
8.4?在Spark程序中使用Shark?Queries
8.5?SharkServer
8.6?思考Shark架構(gòu)
9、Spark程序的測試
9.1?編寫可測試的Spark程序
9.2?Spark測試框架解析
9.3?Spark測試代碼實戰(zhàn)
10、Spark的優(yōu)化
10.1?Logs
10.2?并發(fā)
10.3?內(nèi)存
10.4?垃圾回收
10.5?序列化
10.6?安全
第三部分
11、Spark的機(jī)器學(xué)習(xí)
11.1?LinearRegression
11.2?K-Means
11.3?Collaborative?Filtering
12、Spark的圖計算GraphX
12.1?Table?Operators
12.2?Graph?Operators
12.3?GraphX
13、Spark?SQL
13.1?Parquet支持
13.2?DSL
13.3?SQL?on?RDD
14、Spark實時流處理
14.1?DStream
14.2?transformation
14.3?checkpoint
14.4?性能優(yōu)化