亚洲一区二区在线观,999在线观看免费大全电视剧,国产精品免费区二区三区观看

培訓(xùn)目標(biāo)：

·?徹底理解Hadoop代表的云計(jì)算實(shí)現(xiàn)技術(shù)的能力；

·?具備開發(fā)自己網(wǎng)盤的能力；

·?具備修改HDFS源碼和具體源碼實(shí)現(xiàn)的能力；

·?具備掌握MapReduce內(nèi)部運(yùn)行和實(shí)現(xiàn)細(xì)節(jié)并改造MapReduce的能力；

·?具備掌握Hive企業(yè)級(jí)開發(fā)和管理的能力；

·?掌握Spark的企業(yè)級(jí)開發(fā)的所有核心內(nèi)容，包括Spark架構(gòu)設(shè)計(jì)、Spark內(nèi)核剖析、Shark、SparkSQL、SparkStreaming、、機(jī)器學(xué)習(xí)MLlib、SparkonYarn、JobServer等；

·?掌握Spark和Hadoop協(xié)同工作，能夠通過(guò)Spark和Hadoop輕松應(yīng)對(duì)大數(shù)據(jù)的業(yè)務(wù)需求；

·?掌握企業(yè)線上生產(chǎn)系統(tǒng)中應(yīng)用Spark/Hadoop成功案例，以及與現(xiàn)有企業(yè)BI平臺(tái)整合的方案。

·?掌握Flink的的體系架構(gòu)，以及企業(yè)線上生產(chǎn)系統(tǒng)中應(yīng)用Flink成功案例

·?掌握Flink Runtime、DataSet API、DataStream API，以及Flink SQL的使用

培訓(xùn)對(duì)象：大數(shù)據(jù)架構(gòu)師、數(shù)據(jù)平臺(tái)開發(fā)工程師

學(xué)員基礎(chǔ)：具有一定的數(shù)據(jù)設(shè)計(jì)、開發(fā)和管理經(jīng)驗(yàn)

授課方式：定制課程 + 案例講解 + 小組討論，60%案例講解，40%實(shí)踐演練

主題	章節(jié)	詳細(xì)內(nèi)容
大數(shù)據(jù)平臺(tái)概覽	大數(shù)據(jù)處理平臺(tái)架構(gòu)基礎(chǔ)	大數(shù)據(jù)的產(chǎn)生背景、發(fā)展歷程大數(shù)據(jù)和云計(jì)算的關(guān)系大數(shù)據(jù)應(yīng)用需求以及潛在價(jià)值分析業(yè)界最新的大數(shù)據(jù)技術(shù)發(fā)展態(tài)勢(shì)與應(yīng)用趨勢(shì) 大數(shù)據(jù)項(xiàng)目的技術(shù)選型與大數(shù)據(jù)處理系統(tǒng)架構(gòu)設(shè)計(jì) “互聯(lián)網(wǎng)+”時(shí)代下的電子商務(wù)、制造業(yè)、零售批發(fā)業(yè)、電信運(yùn)營(yíng)商、互聯(lián)網(wǎng)金融業(yè)、網(wǎng)上銀行、電子政務(wù)、移動(dòng)互聯(lián)網(wǎng)、教育信息化等行業(yè)應(yīng)用實(shí)踐與應(yīng)用案例剖析
	業(yè)界主流的大數(shù)據(jù)技術(shù)產(chǎn)品與項(xiàng)目解決方案	國(guó)內(nèi)外主流的大數(shù)據(jù)解決方案介紹當(dāng)前大數(shù)據(jù)解決方案與傳統(tǒng)數(shù)據(jù)庫(kù)方案的剖析比較 Apache大數(shù)據(jù)平臺(tái)方案剖析 CDH大數(shù)據(jù)平臺(tái)方案剖析 HDP大數(shù)據(jù)平臺(tái)方案剖析開源的大數(shù)據(jù)生態(tài)系統(tǒng)平臺(tái)剖析
	Hadoop大數(shù)據(jù)平臺(tái)核心技術(shù)剖析	Hadoop的發(fā)展歷程以及產(chǎn)業(yè)界的實(shí)際應(yīng)用介紹 Hadoop大數(shù)據(jù)平臺(tái)架構(gòu) 基于Hadoop平臺(tái)的PB級(jí)大數(shù)據(jù)存儲(chǔ)管理與分析處理的工作原理與機(jī)制 Hadoop的核心組件剖析
Hadoop的大數(shù)據(jù)體系架構(gòu)	Hadoop的起源	什么是大數(shù)據(jù)？專有云上的混搭平臺(tái)設(shè)計(jì) OLTP系統(tǒng)和OLAP系統(tǒng) 數(shù)據(jù)倉(cāng)庫(kù)的基本概念 Google的基本思想
	Hadoop的體系結(jié)構(gòu)和原理	海量數(shù)據(jù)的存儲(chǔ)HDFS ·??文件上傳的過(guò)程 ·??文件下載的過(guò)程 ·??原信息的合并過(guò)程海量數(shù)據(jù)的計(jì)算MapReduce ·??YARN的工作原理 ·??MapReduce作業(yè)執(zhí)行的過(guò)程和原理 HBase的基本架構(gòu)
	Hadoop集群模式的安裝和配置	單機(jī)模式的安裝和配置偽分布模式的安裝和配置免密碼登錄的原理配置Hadoop的集群環(huán)境配置和使用HUE
	Hadoop HA	集群的規(guī)劃安裝Zookeeper集群環(huán)境安裝配置hadoop集群驗(yàn)證HDFS的HA 驗(yàn)證YARN
	Hadoop應(yīng)用案例分析	案例一：互聯(lián)網(wǎng)應(yīng)用架構(gòu) 案例二：日志分析案例三：Hadoop在淘寶的應(yīng)用
分布式文件系統(tǒng)HDFS	訪問(wèn)HDFS	使用命令行訪問(wèn)HDFS文件系統(tǒng) 使用Java編程接口訪問(wèn)HDFS文件系統(tǒng)
	HDFS的高級(jí)特性	什么是HDFS的聯(lián)盟 HDFS的回收站 HDFS的配額 HDFS的權(quán)限
	HDFS的底層原理	什么是RPC通信？什么是動(dòng)態(tài)代理？
	HDFS的優(yōu)化	NameNode的優(yōu)化策略 SecondaryNameNode的優(yōu)化策略文件存儲(chǔ)的優(yōu)化 HDFS的瓶頸和解決方案
	HDFS的NameNode聯(lián)盟	什么是NameNode的聯(lián)盟 NameNode的體系架構(gòu) 搭建NameNode的聯(lián)盟架構(gòu)
分布式計(jì)算模型MapReduce和Yan	MapReduce基礎(chǔ)編程	MapReduce的基本概念和原理數(shù)據(jù)在MapReduce的流動(dòng)過(guò)程第一個(gè)MapReduce程序和運(yùn)行MapReduce程序
	MapReduce高級(jí)編程	序列化的基本概念編寫MapReduce序列化的程序 MapReduce的排序 MapReduce的分區(qū) 什么是Combiner 什么是Shuffle
	Yarn的優(yōu)化	Yarn的內(nèi)存使用 Yarn的資源調(diào)度策略 MapReduce任務(wù)的優(yōu)化
數(shù)據(jù)分析引擎	數(shù)據(jù)分析之Hive	·??什么是Hive和Hive的體系結(jié)構(gòu) ·??安裝和配置Hive ·??使用HQL ·??Hive的客戶端：CLI客戶端和Java編程 ·??接口 Hive的自定義函數(shù) Hive的數(shù)據(jù)模型 ·??內(nèi)部表 ·??分區(qū)表 ·??桶表 ·??視圖 ·??物化視圖
數(shù)據(jù)分析引擎	數(shù)據(jù)分析之Pig	什么是Pig和Pig的體系結(jié)構(gòu) 安裝和配置Pig Pig的數(shù)據(jù)模型使用Pig Latin語(yǔ)句進(jìn)行數(shù)據(jù)的分析 Pig的自定義函數(shù)
數(shù)據(jù)交換引擎	Sqoop和Flume	使用Sqoop進(jìn)行數(shù)據(jù)的交換 ·??什么是Sqoop體系結(jié)構(gòu) ·??使用Sqoop進(jìn)行數(shù)據(jù)的交換使用Flume進(jìn)行數(shù)據(jù)的采集 ·??什么是Flume體系結(jié)構(gòu) ·??使用Flume進(jìn)行數(shù)據(jù)的采集
基于HDFS的存儲(chǔ)系統(tǒng)	HBase數(shù)據(jù)庫(kù)	HBase簡(jiǎn)介及其在Hadoop中的位置 HBASE的偽分布的搭建 HBASE的底層存儲(chǔ)模型和基本概念 HBASE的讀寫原理 HBASE的高級(jí)特性 HBase的體系結(jié)構(gòu) HBASE Shell HBASE的批量導(dǎo)入 HBASE的Java客戶端
分布式協(xié)調(diào)服務(wù)	Zookeeper	什么是Zookeeper?及其功能 Zookeeper的體系結(jié)構(gòu)和數(shù)據(jù)模型 Zookeeper安裝及測(cè)試 Zookeeper的Java接口 Watcher及內(nèi)部事件 Zookeeper的工作原理基于ZooKeeper的大數(shù)據(jù)的HA架構(gòu)及其實(shí)現(xiàn)
基于Spark的大數(shù)據(jù)分析平臺(tái)	Scala編程語(yǔ)言	Scala語(yǔ)言基礎(chǔ) Scala語(yǔ)言的面向?qū)ο?/span> Scala語(yǔ)言的函數(shù)式編程 Scala中的集合 Scala語(yǔ)言的高級(jí)特性
	Spark Core核心	什么是Spark？Spark生態(tài)圈 Spark的體系結(jié)構(gòu)與安裝部署執(zhí)行Spark Demo程序 Spark運(yùn)行機(jī)制及原理分析 Spark的算子 Spark RDD的高級(jí)算子 Spark基礎(chǔ)編程案例
	Spark SQL數(shù)據(jù)分析引擎	Spark SQL基礎(chǔ) 使用數(shù)據(jù)源性能優(yōu)化在IDEA中開發(fā)Spark SQL程序
	Spark Streaming流式計(jì)算框架	Structured Streaming基礎(chǔ) Structured Streaming的程序模型 Datasets 和 DataFrames API 管理和監(jiān)控流式查詢
基于Hadoop和Spark大數(shù)據(jù)平臺(tái)的機(jī)器學(xué)習(xí)	Mahout和Spark MLlib	在機(jī)器學(xué)習(xí)中的使用，常用算法實(shí)戰(zhàn)（Mahout和spark MLlib） ·??Mahout與Spark MLLib ·??基于協(xié)同過(guò)濾算法 ·??基于ALS協(xié)同過(guò)濾算法 ·??基于Spark MLLib的邏輯回歸算法
下一代大數(shù)據(jù)處理引擎	Flink	Flink介紹 Flink的數(shù)據(jù)集 Flink兩種執(zhí)行模型 Flink-流計(jì)算模型-有界數(shù)據(jù)集處理 Flink的DataSet API Flink的DataStream API 廣播變量、累加器和計(jì)數(shù)器狀態(tài)管理和恢復(fù) Window和Time Flink Table & SQL

四虎在线精品,免费国产小视频在线观看,国产在线一区观看,一级毛片试看60分钟免费播放

大數(shù)據(jù)平臺(tái)搭建與高性能計(jì)算培訓(xùn)課程-中心

課程介紹

最新課程列表