課程內(nèi)容:
01章前期準(zhǔn)備
01-01預(yù)習(xí)視頻:Python基礎(chǔ)語法(pandas、numpy、條件語句、循環(huán)語句)
01-02系統(tǒng)配置:助教遠(yuǎn)程安裝Anaconda(包括Python、Jupyter、extensions)
02章可視化(約1.5天)
02-01厲兵秣馬——Python簡介與Jupyter配置(學(xué)習(xí)基本的環(huán)境設(shè)置,為后期的代碼編輯做準(zhǔn)備)
02-02霧里看花——可視化基本邏輯與主要誤區(qū)(數(shù)據(jù)可視化是什么;數(shù)據(jù)可視化如何在不同的商業(yè)場景中進行應(yīng)用;當(dāng)下熱門的 “一圖看天下”是什么數(shù)據(jù)可視化的誤區(qū)有哪些)
02-03無中生有——變量的理解與隨機數(shù)據(jù)生成(產(chǎn)生模擬的數(shù)據(jù);對數(shù)據(jù)進行拼接;對數(shù)據(jù)進行分割;數(shù)據(jù)的篩選與補充)
02-04循序漸進——散點圖與條形圖的進化過程(散點圖和條形圖的適用數(shù)據(jù)類型;散點圖的主要參數(shù);條形圖的主要參數(shù);散點圖與條形圖的實現(xiàn);可視化過程中的數(shù)據(jù)降維問題)
02-05漸入佳境——用餅圖與環(huán)形圖呈現(xiàn)數(shù)據(jù)比例(餅圖與環(huán)形圖的適用場景,關(guān)聯(lián)與區(qū)別,重要參數(shù),代碼實現(xiàn))
02-06秘境尋蹤——南丁格爾的往事與玫瑰花圖(南丁格爾與玫瑰花圖的起源;玫瑰花圖的基本原理;玫瑰花圖的衍生;相關(guān)圖像的代碼實現(xiàn))
02-07有條不紊——折線圖的設(shè)計與多線條呈現(xiàn)(折線圖的應(yīng)用范圍,主要參數(shù),代碼實現(xiàn);多折線的呈現(xiàn)技巧)
02-08火眼金睛——分布與箱線圖的異常值發(fā)現(xiàn)(什么是數(shù)據(jù)分布;數(shù)據(jù)分布與異常值;分布與箱線圖的主要參數(shù),代碼實現(xiàn))
02-09抽絲剝繭——關(guān)聯(lián)與配對圖的相關(guān)性識別(關(guān)聯(lián)圖與配對圖的關(guān)系與區(qū)別;什么是相關(guān)性;關(guān)聯(lián)圖與配對圖的主要參數(shù),代碼實現(xiàn);圖像內(nèi)涵的信息解釋)
02-10冰火相融——日歷熱力圖中的周期性探索(熱圖的使用場景,數(shù)據(jù)要求,核心參數(shù),代碼實現(xiàn);如何解讀熱圖)
03章礎(chǔ)建模(約1.5天)
03-01線性回歸——車位價格的預(yù)測(線性回歸模型簡介;線性回歸模型檢驗;基于python的線性回歸模型實現(xiàn))
03-02決策樹——平臺風(fēng)險識別(決策樹的基本概念:信息熵、信息增益、GINI;決策樹的剪枝;基于Python的決策樹模型實現(xiàn))
03-03聚類分析——城市的特征分析(常用聚類模型簡介:層次聚類、K均值聚類、密度聚類;基于Python的層次聚類模型實現(xiàn))