曙海教學優勢
本課程面向企事業項目實際需要,秉承二十一年積累的教學品質,騰訊云大數據開發工程師培訓課程以項目實現為導向,老師將會與您分享設計的全流程以及工具的綜合使用技巧、經驗。線上/線下/上門皆可,騰訊云大數據開發工程師培訓課程專家,課程可定制,熱線:4008699035。
大批企業和曙海
建立了良好的合作關系,合作企業30萬+。曙海的課程培養了大批受企業歡迎的工程師。曙海的課程在業內有著響亮的知名度。
騰訊云大數據開發工程師培訓課程
培訓概述
騰訊云大數據開發工程師培訓將通過理論精講與上機實驗相結合的方式,系統性地介紹如何使用大數據技術進行大數據程序開發,以及如何基于騰訊云EMR產品在騰訊云平臺上開通、部署和使用Hadoop大數據系統。
培訓大綱
騰訊云大數據開發工程師培訓課程涵蓋以下內容:
知識模塊 |
簡介 |
大數據技術與生態圈概述 |
1. 大數據與Hadoop概述 2. 騰訊大數據應用案例 3. 大數據行業現狀 4. Hadoop設計思想 5. Hadoop與Spark生態圈 |
EMR產品使用與運維 |
1. 騰訊云EMR產品介紹 2. EMR入門操作與使用說明 3. EMR客戶案例 4. EMR權限控制 5. EMR監控 6. EMR擴容 7. EMR硬件管理 8. EMR參數配置 9. EMR數據遷移 |
HDFS使用 |
1. HDFS概述 2. HDFS架構與組成 3. HDFS操作與API 4. HDFS高可靠保證 5. HDFS與騰訊云COS |
MapReduce編程 |
1. MapReduce框架 2. MapReduce編程模型 3. MapReduce工作原理 4. 資源管理框架YARN |
Hive基礎與操作 |
1. Hive概述與基本架構 2. Hive環境與基礎操作 3. DDL與DML操作 4. Hive系統函數與自定義函數 5. Hive與Sqoop工具 |
HBase使用 |
1. Hbase基礎與架構 2. Hbase數據結構 3. Hbase內置表與讀寫流程 4. Hbase使用與API |
Presto架構與使用 |
1. Presto概述 2. Presto整體架構與運行原理 3. Presto Connector 4. Presto常用函數 |
SparkCore基礎與開發 |
1. Spark概述 2. Spark程序與RDD操作 3. 普通型RDD Transformation操作 4. 鍵值型RDD Transformation操作 5. RDD Action操作 6. RDD共享變量、持久化與依賴 7. Spark架構與運行 8. Tez、Spark與MR對比 9. Spark WordCount演示 |
SparkSQL開發 |
1. SparkSQL概述與架構 2. DataFrame與DataSet 3. SparkSQL數據源操作 4. SparkSQL自定義函數 |
SparkStreaming開發 |
1. SparkStreaming概述 2. SparkStreaming運行流程 3. SparkStreaming基礎算子 4. SparkStreaming高級算子 5. SparkStreaming案例 6. Spark與Storm區別 |
Kafka基礎與開發 |
1. Kafka概述 2. Kafka架構與關鍵機制 3. Ckafka API與實戰 4. SparkStreaming與Kafka整合 |
數據挖掘與機器學習基礎 |
1. 大數據分析介紹 2. 機器學習概念 3. 機器學習分類 4. 常見分析模型與算法 5. 用戶畫像應用基礎與構建 |
課程實驗 |
1. 實驗1-Hadoop實驗環境準備 2. 實驗2-HDFS分布式文件系統 3. 實驗3-COS存儲系統 4. 實驗4-MapReduce分布式計算框架 5. 實驗5-Hive數據庫表創建和數據加載 6. 實驗6-分布式列式數據庫Hbase 7. 實驗7-Presto數據庫表創建和數據加載 8. 實驗8-離線日志分析 9. 實驗9-Spark內存計算框架 10. 實驗10-Spark實戰 11. 實驗11-Ckafka生產者消費者實踐 12. 實驗12-EMR集群的運維 13. 實驗13-互聯網電商日志分析系統實戰 14. 實驗14-基于用戶畫像的推薦實戰 |
?