課程筆記:機(jī)器學(xué)習(xí)基礎(chǔ) Week 6
-
將SVD應(yīng)用于特定數(shù)據(jù)集
-
在特定背景下分析PCA的結(jié)果
-
繪制并解釋奇異值(碎石圖)
-
選擇r值以達(dá)到期望的方差捕獲水平
-
在Python中實(shí)現(xiàn)K-Means算法
-
在Python中應(yīng)用K-Means函數(shù)
-
在給定初始數(shù)據(jù)集的情況下解釋K-Means和PCA的結(jié)果
-
使用scikit-learn進(jìn)行K-Means聚類
-
比較兩種不同的質(zhì)心初始化方法(k-means++ vs. 隨機(jī)初始化)
-
比較在給定數(shù)據(jù)集上的多種聚類技術(shù)的結(jié)果
應(yīng)用SVD到特定數(shù)據(jù)集
-
數(shù)據(jù)歸一化:首先通過減去均值并除以標(biāo)準(zhǔn)差對(duì)數(shù)據(jù)進(jìn)行歸一化處理。
-
執(zhí)行SVD:在歸一化的數(shù)據(jù)上執(zhí)行奇異值分解(SVD)。
驗(yàn)證分解:通過矩陣乘法重構(gòu)原始數(shù)據(jù),并檢查結(jié)果是否與歸一化數(shù)據(jù)一致
思路:

3. 繪制和解釋奇異值(碎石圖)
步驟:

思路:

4. 選擇r值以達(dá)到所需的方差捕獲水平
步驟:

5. 在Python中實(shí)現(xiàn)K-Means算法
步驟:

思路:

6. 在Python中應(yīng)用K-Means函數(shù)
步驟:


7. 解釋K-Means和PCA的結(jié)果
思路:

8. 使用Scikit-Learn進(jìn)行K-Means聚類
步驟:

9. 比較初始化方法(k-means++ vs. 隨機(jī)初始化)
關(guān)鍵點(diǎn):

10. 比較多種聚類技術(shù)
技術(shù):

比較:

1.區(qū)分線性模型和非線性模型
2.使用Plotly擬合簡(jiǎn)單線性回歸線
3.計(jì)算平方誤差和絕對(duì)誤差
4.識(shí)別損失函數(shù)對(duì)離群值的反應(yīng)
5.應(yīng)用多種技術(shù)來最小化損失函數(shù)
6.使用多元線性回歸模型預(yù)測(cè)結(jié)果
7.識(shí)別數(shù)據(jù)集中序數(shù)、名義和分類數(shù)據(jù)

2. 如何擬合線性回歸
步驟:

代碼:
導(dǎo)入必要的數(shù)據(jù)庫(kù):

構(gòu)建模型:

回歸模型可視化:

3. 如何計(jì)算平方誤差和絕對(duì)誤差

代碼:

4.如何識(shí)別損失函數(shù)對(duì)離群值的反應(yīng)

5. 應(yīng)用多種技術(shù)來最小化損失函數(shù)

代碼:


代碼:

7. 識(shí)別數(shù)據(jù)中的序數(shù)、名義和分類數(shù)據(jù)

代碼:

中國(guó)礦業(yè)大學(xué)(北京)人工智能碩士
實(shí)習(xí)工程師
研究方向?yàn)檫x礦設(shè)備、選礦流程的智能化。本科期間曾獲全國(guó)大學(xué)生數(shù)學(xué)競(jìng)賽二等獎(jiǎng)、北京市大學(xué)生數(shù)學(xué)競(jìng)賽一等獎(jiǎng)、礦大(北京)第九屆力學(xué)競(jìng)賽二等獎(jiǎng)、校獎(jiǎng)學(xué)金等。研究生階段。
中國(guó)礦業(yè)大學(xué)(北京) 副教授 博導(dǎo)
博士畢業(yè)于中國(guó)礦業(yè)大學(xué),礦物加工工程專業(yè)(導(dǎo)師:劉炯天院士)。美國(guó)哥倫比亞大學(xué),環(huán)境工程系聯(lián)合培養(yǎng)博士(導(dǎo)師:Ponisseril
Somasundaran
教授)。目前在中國(guó)礦業(yè)大學(xué)(北京)擔(dān)任化環(huán)學(xué)院礦加系主任,博士生導(dǎo)師。曾主持多項(xiàng)國(guó)家/省級(jí)科研課題。主要研究方向包括:微細(xì)粒分選理論及選礦工藝、低品質(zhì)煤高效分選過程強(qiáng)化、工業(yè)水處理、分子動(dòng)力學(xué)模擬、礦物資源綜合利用、礦物加工設(shè)備智能化等。
網(wǎng)址:
www.gdyuanan.com
(中文站)
www.alpha-technology.com.au(英文站)