曙海教學優勢
本課程面向企事業項目實際需要,秉承二十一年積累的教學品質,大數據架構與數據挖掘培訓課程以項目實現為導向,老師將會與您分享設計的全流程以及工具的綜合使用技巧、經驗。線上/線下/上門皆可,大數據架構與數據挖掘培訓課程專家,課程可定制,熱線:4008699035。
大批企業和曙海
建立了良好的合作關系,合作企業30萬+。曙海的課程培養了大批受企業歡迎的工程師。曙海的課程在業內有著響亮的知名度。
?
本課程將為大家全面而又深入的介紹Hadoop和Spark平臺的構建流程,涉及Hadoop和Spark系統基礎知識,概念及架構, Hadoop和Spark實戰技巧(數據挖掘和機器學習),Hadoop和Spark經典案例等。
通過本課程實踐,幫助學員對Hadoop生態系統有一個清晰明了的認識;理解Hadoop系統適用的場景;掌握Hadoop等初 中級應用開發技能;搭建穩定可靠的Hadoop集群,滿足生產環境的標準;掌握如何應用hadoop和spark完成數據挖掘和機器學習任務;了解和清楚大數據應用的幾個行業中的經典案例。
各類 IT/軟件企業和研發機構的軟件架構師、軟件設計師、程序員。對于懷有設計疑問和問題,需要梳理解答的團隊和個人,效果最佳。
學員學習本課程應具備下列基礎知識: 1) 了解Java語言; 2) 了解Linux系統;
3) 數據挖掘基礎
?
主題 | 內容 |
大數據架構概述 |
1. 大數據層級結構 |
數據收集系統Flume與Sqoop |
介紹如何使用flume和sqoop兩個系統將外部流式數據(比如網站日志,用戶行為數據等)、關系型數據庫(比如MySQL、Oracle等)中的數據導入Hadoop中進行分析和挖掘 |
大數據存儲系統HDFS與HBase |
1. 1. HDFS 2.0 原理、特性與基本架構 |
分布式計算技術MapReduce與Hive |
1. 介紹計算框架MapReduce基本原理,架構及程序設計方式 |
分布式計算技術Spark |
1. 介紹計算框架Spark基本原理,架構及程序設計方式 |
數據挖掘與機器學習 |
1. 常見的數據挖掘與機器學習算法 |
應用案例1:基于Hadoop的構建數據倉庫 |
1. 數據倉庫基礎介紹 |
應用案例2:用戶畫像系統 |
1. 什么是用戶畫像系統 |
應用案例3:商品推薦系統 |
1. 什么是商品推薦系統 |
應用案例4:數據挖掘系統 |
1. 什么是數據挖掘系統 |