
曙海教學(xué)優(yōu)勢(shì)
該課程,秉承21年教學(xué)品質(zhì),以項(xiàng)目實(shí)現(xiàn)為導(dǎo)向,面向企事業(yè)單位項(xiàng)目實(shí)際需求,講師將會(huì)與您分享設(shè)計(jì)的全流程以及工具的綜合使用技巧與經(jīng)驗(yàn)。課程可定制,線(xiàn)下/線(xiàn)上/上門(mén)皆可,全國(guó)免費(fèi)報(bào)名熱線(xiàn):4008699035。
曙海培訓(xùn)的課程培養(yǎng)了大批受企業(yè)歡迎的工程師。大批企業(yè)和曙海
建立了良好的合作關(guān)系,合作企業(yè)三十多萬(wàn)家。曙海的課程得到業(yè)內(nèi)企事業(yè)單位廣泛贊譽(yù)。
本課程介紹了數(shù)據(jù)挖掘的基本原理,從數(shù)據(jù)挖掘基礎(chǔ)知識(shí)開(kāi)始,講解數(shù)據(jù)挖掘建模工具和使用Python語(yǔ)言進(jìn)使用工具;學(xué)習(xí)數(shù)據(jù)挖掘的建模過(guò)程,包括數(shù)據(jù)探索、數(shù)據(jù)預(yù)處理及挖掘建模的常用算法與原理。
?? 了解一個(gè)完整的數(shù)據(jù)分析過(guò)程,從數(shù)據(jù)采集到挖掘,清洗,分析和輸出的整個(gè)過(guò)程。。?
?? 學(xué)習(xí)Python數(shù)據(jù)分析方法和工具的使用?
?? 學(xué)習(xí)各種數(shù)據(jù)分析的算法和框架。?
?? 學(xué)習(xí)各種建模方式和工具的使用?
?? 基于案例學(xué)習(xí)客戶(hù)價(jià)值分析等數(shù)據(jù)挖掘應(yīng)用場(chǎng)景?
|
模塊名稱(chēng)? |
課程內(nèi)容? |
|
Python基礎(chǔ)和數(shù)據(jù)科學(xué)基礎(chǔ)? |
1.????? Python語(yǔ)言和開(kāi)發(fā)環(huán)境簡(jiǎn)介? 2.????? 數(shù)據(jù)科學(xué)概述? 3.????? 數(shù)據(jù)分析流程和步驟? 4.????? 數(shù)據(jù)獲取路徑? 5.????? 法律法規(guī) 6.????? Python語(yǔ)言和數(shù)據(jù)科學(xué) 7.????? 理解基本的字符串函數(shù) 8.????? 選擇合適的數(shù)據(jù)結(jié)構(gòu) 9.????? 通過(guò)列表推導(dǎo)式理解列表 10.?? 使用計(jì)數(shù)器,使用文件和網(wǎng)絡(luò) 11.?? 使用正則表達(dá)式實(shí)現(xiàn)模式匹配? 12.?? globbing文件名與其他字符串 13.?? Pickling和Unpickling數(shù)據(jù) 14.?? 文本數(shù)據(jù)的處理 15.?? 數(shù)據(jù)庫(kù)數(shù)據(jù)的處理 16.?? 通用函數(shù)和各類(lèi)聚合函數(shù) |
|
Python數(shù)據(jù)分析基礎(chǔ)? |
1.????? 搭建Python開(kāi)發(fā)平臺(tái)? 2.????? 所要考慮的問(wèn)題? 3.????? 基礎(chǔ)平臺(tái)的搭建? 4.????? Python使用入門(mén)? 5.????? 運(yùn)行方式? 6.????? 基本命令? 7.????? 數(shù)據(jù)結(jié)構(gòu)? 8.????? 庫(kù)的導(dǎo)入與添加? 9.????? Python數(shù)據(jù)分析工具? 10.?? ?Numpy? 11.?? ?Scipy? 12.?? ?Matplotlib? 13.?? ?Pandas? 14.?? ?StatsModels? 15.?? ?Scikit-Learn? 16.?? ?Keras? 17.?? ?Gensim? |
|
數(shù)據(jù)探索? |
1.????? 數(shù)據(jù)質(zhì)量分析? 2.????? 缺失值分析? 3.????? 異常值分析? 4.????? 一致性分析? 5.????? 數(shù)據(jù)特征分析? 6.????? 分布分析? 7.????? 對(duì)比分析? 8.????? 統(tǒng)計(jì)量分析? 9.????? 周期性分析? 10.?? 貢獻(xiàn)度分析? 11.?? 相關(guān)性分析? 12.?? Python主要數(shù)據(jù)探索函數(shù)? 13.?? 基本統(tǒng)計(jì)特征函數(shù)? 14.?? 拓展統(tǒng)計(jì)特征函數(shù)? 15.?? 統(tǒng)計(jì)作圖函數(shù)? |
|
數(shù)據(jù)預(yù)處理? |
1.????? 數(shù)據(jù)清洗60? 2.????? 缺失值處理60? 3.????? 異常值處理64? 4.????? 數(shù)據(jù)集成64? 5.????? 實(shí)體識(shí)別64? 6.????? 冗余屬性識(shí)別65? 7.????? 數(shù)據(jù)變換65? 8.????? 簡(jiǎn)單函數(shù)變換65? 9.????? 規(guī)范化66? 10.?? 連續(xù)屬性離散化68? 11.?? 屬性構(gòu)造70? 12.?? 小波變換71? 13.?? 數(shù)據(jù)規(guī)約74? 14.?? 屬性規(guī)約74? 15.?? 數(shù)值規(guī)約77? 16.?? Python主要數(shù)據(jù)預(yù)處理函數(shù)80? |
|
數(shù)據(jù)挖掘建模? |
1.????? 分類(lèi)與預(yù)測(cè)83? 2.????? 實(shí)現(xiàn)過(guò)程83? 3.????? 常用的分類(lèi)與預(yù)測(cè)算法84? 4.????? 回歸分析85? 5.????? 決策樹(shù)89? 6.????? 人工神經(jīng)網(wǎng)絡(luò)95? 7.????? 5.1.6?分類(lèi)與預(yù)測(cè)算法評(píng)價(jià)100? 8.????? 5.1.7?Python分類(lèi)預(yù)測(cè)模型特點(diǎn)103? 9.????? 5.2?聚類(lèi)分析104? 10.?? 5.2.1?常用聚類(lèi)分析算法104? 11.?? 5.2.2?K-Means聚類(lèi)算法105? 12.?? 5.2.3?聚類(lèi)分析算法評(píng)價(jià)111? 13.?? 5.2.4?Python主要聚類(lèi)分析算法111? 14.?? 5.3?關(guān)聯(lián)規(guī)則113? 15.?? 5.3.1?常用關(guān)聯(lián)規(guī)則算法114? 16.?? 5.3.2?Apriori算法114? 17.?? 5.4?時(shí)序模式119? 18.?? 5.4.1?時(shí)間序列算法120? 19.?? 5.4.2?時(shí)間序列的預(yù)處理120? 20.?? 5.4.3?平穩(wěn)時(shí)間序列分析122? 21.?? 5.4.4?非平穩(wěn)時(shí)間序列分析124? 22.?? 5.4.5?Python主要時(shí)序模式算法132? 23.?? 5.5?離群點(diǎn)檢測(cè)134? 24.?? 5.5.1?離群點(diǎn)檢測(cè)方法135? 25.?? 5.5.2?基于模型的離群點(diǎn)檢測(cè)方法136? 26.?? 5.5.3?基于聚類(lèi)的離群點(diǎn)檢測(cè)方法138? |
|
數(shù)據(jù)挖掘?qū)崙?zhàn)項(xiàng)目一—客戶(hù)價(jià)值分析? |
1.????? 背景與挖掘目標(biāo)164? 2.????? 7.2?分析方法與過(guò)程166? 3.????? 7.2.1?數(shù)據(jù)抽取168? 4.????? 7.2.2?數(shù)據(jù)探索分析168? 5.????? 7.2.3?數(shù)據(jù)預(yù)處理169? 6.????? 7.2.4?模型構(gòu)建173? |
|
數(shù)據(jù)挖掘?qū)崙?zhàn)項(xiàng)目二--電子商務(wù)網(wǎng)站用戶(hù)行為分析及服務(wù)推薦? |
1.????? 背景與挖掘目標(biāo)238? 2.????? 12.2?分析方法與過(guò)程240? 3.????? 12.2.1?數(shù)據(jù)抽取242? 4.????? 12.2.2?數(shù)據(jù)探索分析244? 5.????? 12.2.3?數(shù)據(jù)預(yù)處理251? 6.????? 12.2.4?模型構(gòu)建256? |
|
協(xié)議分析? |
1.????? Web端協(xié)議分析? 2.????? 網(wǎng)頁(yè)登錄POST分析 3.????? 隱藏表單分析 4.????? 加密數(shù)據(jù)分析 5.????? 驗(yàn)證碼問(wèn)題 6.????? IP代理 7.????? Cookie登錄 8.????? 傳統(tǒng)驗(yàn)證碼識(shí)別 9.????? 人工打碼 10.?? 滑動(dòng)驗(yàn)證碼 11.?? PC客戶(hù)端抓包分析 12.?? HTTP Analyzer簡(jiǎn)介 13.?? 蝦米音樂(lè)PC端API實(shí)戰(zhàn)分析 14.?? App抓包分析 15.?? Wireshark簡(jiǎn)介 16.?? 酷我聽(tīng)書(shū)App端API實(shí)戰(zhàn)分析 17.?? API爬蟲(chóng):爬取mp3資源信息 |
|
Scrapy爬蟲(chóng)框架? |
1.????? Scrapy爬蟲(chóng)架構(gòu) 2.????? 安裝Scrapy? 3.????? 創(chuàng)建cnblogs項(xiàng)目 4.????? 創(chuàng)建爬蟲(chóng)模塊? 5.????? 定義Item? 6.????? 翻頁(yè)功能 7.????? 構(gòu)建Item Pipeline? 8.????? 內(nèi)置數(shù)據(jù)存儲(chǔ)? 9.????? 啟動(dòng)爬蟲(chóng) 10.?? 強(qiáng)化爬蟲(chóng) 11.?? 調(diào)試方法? 12.?? 異常 13.?? 控制運(yùn)行狀態(tài) 14.?? Item Loader 15.?? Item與Item Loader 16.?? 輸入與輸出處理器 17.?? Item Loader Context?? 18.?? 請(qǐng)求與響應(yīng) 19.?? 下載器中間件 20.?? Spider中間件? 21.?? 擴(kuò)展 22.?? 突破反爬蟲(chóng) |
|
增量式與分布式爬蟲(chóng)? |
1.????? 去重方案 2.????? ?BloomFilter算法? 3.????? ?BloomFilter原理 4.????? ?Python實(shí)現(xiàn)BloomFilter 5.????? Scrapy和BloomFilter 6.????? Redis基礎(chǔ) 7.????? Redis的安裝和配置 8.????? Redis數(shù)據(jù)類(lèi)型與操作 9.????? Python和Redis 10.?? Python操作Redis 11.?? Scrapy集成Redis 12.?? MongoDB集群? |
|
PySpider爬蟲(chóng)框架? |
1.????? PySpider與Scrapy 2.????? 選擇器 3.????? PyQuery的用法 4.????? ?解析數(shù)據(jù) 5.????? Ajax和HTTP請(qǐng)求 6.????? ?Ajax爬取 7.????? HTTP請(qǐng)求實(shí)現(xiàn)? 8.????? ?PySpider和PhantomJS 9.????? 使用PhantomJS 10.?? 運(yùn)行JavaScript 11.?? 數(shù)據(jù)存儲(chǔ) 12.?? PySpider爬蟲(chóng)架構(gòu) |
?