課程: 論文研討(一)
日期 : 2012/12/21
時間 : 13:50 ~ 15:30
學生 : 資傳研一 邱文祥
演講者 : 海洋大學資訊工程學系 張欽圳
資料分群(data clustering)或是分群演算法(clustering algorithms)是一種將資料分類成群的方法,其主要的目的乃在於找出資料中較相似的幾個群聚(clusters),並找出各個群聚的代表點,稱為中心點(centroids)或是原型(prototypes)。使用這些中心點來代表原先大量的資料點,就可以達到兩個基本目標:
- 降低計算量
- 資料壓縮
一般而言,分群法可以大致歸為兩大類:
- 階層式分群法(hierarchical clustering):群數(number of clusters)可以由大變小,或是由小變大,來進群聚的合併或分裂,最後再選取最佳的群數。
- 分割式分群法(partitional clustering):先指定群數後,再用一套疊代的數學運算法,找出最佳的分群方式以及相關的群中心。
所有的分群法都有相似的流程,大略可歸納為下列三點:
- 收集資料
- 使用某種方法進行分群
- 測試分群結果
- 檢測分群結果,如果未達預期效果,則回到步驟二,再一次進行分群
沒有留言:
張貼留言