機器學習之---K均值法

//本文為作者原創,在同名公眾號和CSDN賬號同步發佈,歡迎大家關注//

K均值法屬於無監督學習範疇,是應用最廣泛的聚類學習方法,該方法用於對無標籤的數據根據特徵的相近程度分類。


機器學習之---K均值法


K均值法原理:K均值法的原理是選擇K個聚類中心,然後將聚類中心初始化,計算距離聚類中心較近的點並將其歸為一類,然後將各類的點分別求平均值,將聚類中心移動到該均值處,以此方法循環直到均值點收斂。

聚類中心數目選擇:聚類中心數目可以通過肘部法則來確定,肘部法則即將聚類中心數目不斷增加聚類算法的代價函數不斷減小,在某個值處形成明顯的拐點,該點對應的K值就是最佳聚類中心數。

有些算法模型沒有明顯拐帶你怎麼辦?當有些模型代價函數下降沒有明顯的拐點,這時K值的選擇需要根據要分類物體的實際情況確定K值,如衣服尺碼數量確定K值。可就是說樣本自身會有明確的認為認知的分類標準。

注意:K均值法對聚類中心點的初始值是隨機的容易陷入局部最優解,所以需要多次初始化選擇代價函數最小的模型。


分享到:


相關文章: