課程內(nèi)容:
01章機(jī)器學(xué)習(xí)入門介紹(1小時(shí))
01-01什么是機(jī)器學(xué)習(xí)
01-02機(jī)器學(xué)習(xí)中的名詞說(shuō)明:類型、字段、特征、標(biāo)簽等
01-03機(jī)器學(xué)習(xí)中的基本概念:分類、預(yù)測(cè)、回歸;有監(jiān)督、無(wú)監(jiān)督;模型效果、計(jì)算速度;可解釋性、泛化能力等
01-04推薦工具書
02章scikit-learn入門:Scikit-Learn庫(kù)簡(jiǎn)介(0.5小時(shí))
03章KNN-最近鄰分類算法:以電影分類為例(1.5小時(shí))
03-01模型建立基本思路
03-02KNN原理基礎(chǔ)及其實(shí)現(xiàn): KNN原理基礎(chǔ)距離的確認(rèn):歐幾里得距離、馬曼哈頓距離、閔可夫斯基距離; KNN的scikit-learn實(shí)現(xiàn):模型的構(gòu)建與評(píng)估
03-03模型優(yōu)化:學(xué)習(xí)曲線、交叉驗(yàn)證
03-04模型評(píng)價(jià)與總結(jié)
04章決策樹算法:泰坦尼克幸存者預(yù)測(cè)為例(3小時(shí))
04-01決策樹基本原理
04-02決策樹的scikit-learn實(shí)現(xiàn):八個(gè)參數(shù)(Criterion、兩個(gè)隨機(jī)性相關(guān)的參數(shù)、五個(gè)剪枝參數(shù))、一個(gè)屬性、四個(gè)接口)解析
04-03分類模型的評(píng)估指標(biāo)(混淆矩陣原理、scikit-learn中的混淆矩陣)
04-04實(shí)例:泰坦尼克號(hào)幸存者的預(yù)測(cè)(數(shù)據(jù)導(dǎo)入、數(shù)據(jù)處理、模型構(gòu)建與評(píng)估、利用混淆矩陣調(diào)參)
05章隨機(jī)森林算法:以乳腺癌預(yù)測(cè)為例(3小時(shí))
05-01隨機(jī)森林概述:集成算法概述Bagging vs Boosting、集成算法的認(rèn)識(shí)
05-02隨機(jī)森林分類器的實(shí)現(xiàn):重要參數(shù)、重要屬性和接口
06章K-Means聚類算法:以電商用戶畫像為例(3小時(shí))
06-01聚類算法概述:聚類VS分類
06-02KMeans原理分析
06-03KMeans的scikit-learn實(shí)現(xiàn)(模型構(gòu)建與評(píng)估(輪廓系數(shù))、重要參數(shù)解析、實(shí)例:根據(jù)輪廓系數(shù)選擇簇)
07章關(guān)聯(lián)規(guī)則算法:啤酒與尿布關(guān)聯(lián)規(guī)則分析(2小時(shí))
07-01關(guān)聯(lián)規(guī)則概述:頻繁項(xiàng)集的產(chǎn)生與關(guān)聯(lián)發(fā)現(xiàn)
07-02Apriori算法原理:先驗(yàn)原理
07-03使用Apriori算法來(lái)發(fā)現(xiàn)頻繁項(xiàng)集(生成候選項(xiàng)集(函數(shù)的構(gòu)建與封裝)、項(xiàng)集迭代函數(shù))
08章線性回歸模型在數(shù)據(jù)分析領(lǐng)域的應(yīng)用:以房?jī)r(jià)預(yù)測(cè)為例(1小時(shí))
09章邏輯回歸:以信用卡反欺詐模型為例(3小時(shí))
09-01邏輯回歸概述:模型參數(shù)、sigmoid函數(shù)、邏輯回歸的返回值解析
09-02邏輯回歸的特點(diǎn):模型擬合效果、計(jì)算速度、返回值的可解釋型
09-03邏輯回歸模型的構(gòu)建與優(yōu)化: 認(rèn)識(shí)邏輯回歸的損失函數(shù); 重要參數(shù)解析; 梯度下降求解最小損失函數(shù)參數(shù)值
10章SVM支持向量機(jī)概述、應(yīng)用及scikit-leaern實(shí)現(xiàn)(1小時(shí))
11章分類模型的評(píng)估指標(biāo)(2小時(shí))
12章樸素貝葉斯算法:以文本分類為例(3小時(shí))
12-01樸素貝葉斯概述
12-02應(yīng)用:文本分類的實(shí)現(xiàn)