培訓模塊 |
培訓內容 |
數據治理概覽 |
- 什么是數據治理
- 為什么要進行數據治理
- 數據治理都有哪些工作
- 如何設計理想的數據基礎架構。
- 如何針對各種應用需求,設計數據應用架構模型。
- 如何基于元數據模型定制應用數據模型。
- 如何對數據的存儲空間、數據倉庫進行規劃。
- 如何建立各個數據之間的結構一致性,
- 如何建立各個數據存儲空間之間的數據同步。
- 如何對數據的質量進行監控。
- 某企業數據整理實例回顧與分析
|
現有的數據建模與問題診斷
|
結合案例講解:現有數據建模和診斷
- 現有的數據調查
- 數據現狀建模
- 數據問題診斷與分析
- 確定數據整理的目標
- 確定數據治理的策略
|
設計數據架構框架 |
結合案例講解:設計數據架構框架方法與實踐
數據架構的構成:
- 建立元數據層框架
- 建立數據規范
- 簡歷數應用層框架
|
元數據的定義與設計 |
結合案例講解:元數據的定義與設計方法與實踐
- 元數據的定義
- 元數據的使用場景
- 元數據的分類
- 如何從現有業務數據中提煉元數據
- 元數據的分類
- 元數據的聚集
- 元數據的關系建模
- 元數據的結構建模
- 元數據的存儲設計
- 元數據的管理方法
- 建立從元數據到應用數據的配置過程指南
|
主數據的結構治理 |
結合案例講解:主數據的結構治理方法與實踐
- 什么是主數據
- 結合實例講解主數據的建立方法:
- 如何基于業務識別主數據識別
- 主數據的關系建模
- 主數據的結構建模
- 如何基于元數據配置主數據結構
- 主數據的邏輯設計
- 主數據的物理設計
- 主數據的管理方法
- 主數據管理系統和技術支持架構
- 多個主題數據的集成方法
主數據案例練習與討論
|
數據標準的指定 |
結合案例講解:數據標準的指定的方法與實踐
- 數據標準定義
- 數據標準管理規范
- 數據標準建設模型,過程
- 案例介紹
|
數據質量的評價與優化 |
結合案例講解:數據質量的評價與優化的方法與實踐
- 控制數據質量的方法
- 數據質量管理模型
- 數據知識庫
- 利用知識庫對數據進行清洗,匹配
- 自動化進行數據質量控制的方法
- 數據質量產品介紹
|
數據采集 |
結合案例講解:數據采集的方法與實踐
- 數據采集方法
- 數據采集常用工具講解,SSIS,Kettle
- 實時數據采集
- 數據采集定期自動化
- 數據采集日志和錯誤管理方法
|
數據存儲空間的治理 |
結合案例講解:數據存儲空間的治理的方法與實踐
- 數據存儲空間典型的劃分模式
- 數據存儲空間要考慮的問題
- 如何分析數據容量增長需求規劃數據存儲空間策略
- 典型的數據存儲空間治理原則
- 各個數據存儲空間之間的數據同步策略
- 數據倉庫的數據備檔和應用分析設計
|
數據擴展設計 |
結合案例講解:數據擴展設計的方法與實踐
- 數據存在哪些擴展需求
- 數據擴展帶來的變更成本分析
- 數據擴展對業務和應用的影響分析
- 數據結構擴展的設計方法
- 數據容量的擴展設計方法
- 如何建立具有可持續擴展能力的數據架構
|
數據安全設計 |
結合案例講解:數據安全設計的方法與實踐
- 數據安全管理范圍
- 分析整個數據架構存在哪些安全風險
- 數據安全的建模
- 數據資源使用場景分析
- 數據入侵的風險和檢測方法
- 數據并發造成的不一致問題
- 數據安全設計原則
- 數據安全的典型處理策略
- 數據安全技術架構
- 數據安全生命周期管理
|
數據倉庫的建模與設計 |
結合案例講解:數據倉庫的建模與設計的方法與實踐
數據倉庫的建模方法
- 數據倉庫模型解決什么問題?
- 數據倉庫環境的數據結構是什么?
- 為什么多維模型是整個數據倉庫的模型基礎?
- 數據倉庫中還需要E-R模型嗎?
- 星型模式解決的問題
- 雪花模式解決的問題
結合案例講解:元數據的定義與設計方法與實踐
數據倉庫的設計
- 如何從分析業務
- 定義業務模型
- 執行策略分析的方法
- 使用業務處理矩陣分析業務模型
- 如何從業務中識別業務測量指標和維
- 如何定義顆粒度
- 確定業務定義和規則的重要性
- 編制元數據
- 業務元數據元素
|
數據建模的邏輯模型 |
結合案例講解:數據建模的邏輯模型方法與實踐
數據建模邏輯模型
- 定義邏輯模型
- 定義維模型
- 星型維模式
- 星型維模式優點
- 實事表的特征
- 非可加性事實和半可加性事實的設計方法
- 事實表事實如何選取
- 識別基本事實指標和驅動事實指標
- 維表特點
- 緩慢變化維
- 數據庫鍵類型
- 定義維的層次
- 明細業務事實粒度選取
- 如何對事實進行匯總
- 數據鉆取
|
數據建模的物理模型 |
結合案例講解:數據建模的物理模型的方法與實踐
數據建模物理模型
- 定義物理模型
- 轉換維模型到物理模型
- 物理模型架構要求
- 硬件設計(cpu架構,ssd,?內存)
- 大數據存儲設計和性能設計
- 大數據評估數據庫容量
- 大數據數據分區優化技術
- 大數據索引優化設計
- 星型查詢優化
- 大數據并行數據處理優化技術
- 大數據使用聚合優化技術
- 設計數據倉庫的安全性
|
數據治理案例介紹 |
|