層次聚類流程圖

  層次聚類就是通過對資料集按照某種方法進行層次分解,直到滿足某種條件為止。以下是小編為大家整理的關於,給大家作為參考,歡迎閱讀!

  

  層次聚類的分類

  根據聚類原理步驟3的不同, 可將層次式聚類方法分為幾類: single-linkage, complete-linkage 以及average-linkage 聚類方法等.

  SL層次聚類

  SL聚類,即single-linkage聚類法***也稱connectedness 或minimum 方法***:

  類間距離等於兩類物件之間的最小距離,若用相似度衡量,則是各類中的任一物件與另一類中任一物件的最大相似度。

  CL層次聚類

  CL層次聚類,即complete-linkage聚類法***也稱diameter 或maximum 方法***:

  組間距離等於兩組物件之間的最大距離。

  AL層次聚類

  AL層次聚類,即average-linkage聚類法組間距離等於兩組物件之間的平均距離。

  average-link 聚類的一個變種是R. D'Andrade ***1978*** 的UCLUS方法, 它使用的是median距離, 在受異常資料物件的影響方面, 它要比平均距離表現更佳一些.

  這種層次聚類稱為“凝聚"法,由於它迭代合併所有分類。也有一種“劃分”層次聚類法,與“凝聚”相反,它先將所有物件放在同一類中,並不斷劃分成更小的類,劃分法一般很少使用。