2013年1月11日 星期五

Introduction to Distance Metric Learning


課程論文研討(一)
日期 : 2012/12/21
時間 : 13:50 ~ 15:30
學生 : 資傳研一 林智偉
演講者 : 海洋大學資訊工程學系 張欽圳

心得:

    今天的演講者是來自海洋大學資工系的張欽圳老師以距離測度學習(distance metric learning)為主題,會偵對度量這方面的應用方向、發展狀況等做了詳細的介紹。
在數學中,度量(度規)或距離函數是定義在集合的元素之間的距離的函數。帶有度量的集合叫做度量空間。

    度量引發在集合上的拓撲但不是所有拓撲都可以由度量生成。當一個拓撲空間有可以由度量來描述的拓撲的時候,我們稱這個拓撲空間為可度量化的。

    在微分幾何中,單詞「度量」也用來稱呼只定義在向量空間上一種結構,它的更適合的術語是度量張量(或黎曼度量或偽黎曼度量)。距離測度即衡量多個樣本之間距離的大小,最常見的是度量空間中的歐氏距離、曼哈頓距離等。但是對於其他類型的多維度數據,由於每個維度的貢獻程度不同、提取維度的量綱有差異等原因,就需要依據數據的特性,採用維度的旋轉等方式來較為準確的表示各自的距離。

    這些條件表達了關於距離概念的直覺想法。例如,在獨特點之間的距離是正數的並且從 x 到 y 的距離同於從 y 到 x 的距離。三角不等式意味著在 x 和 z 之間的距離不大於從 x 到 y 接著從 y 到 z 的距離。歐幾里得在他的著作中聲稱在兩點之間最短距離是直線;這是他的幾何中的三角不等式。

    在微分幾何中,考慮度量張量,它可以被認為是「無窮小」度量函數。它們被定義為在切空間上的內積,帶有適當的可微性要求。儘管它們不是本文定義的度量函數,它們通過不定積分引發度量函數。帶有度量張量的流形叫做黎曼流形。如果去掉內積空間的的正定性要求,則得到偽黎曼度量張量,它積分為偽半度量。它們用於相對論的幾何研究中,這裡的張量也叫做「不變距離」。


    透過這些分群或分類的演算法,可以讓機器學習,透過Distance metric距離大小讓分群或分類更精準,並且可以過權重分配的方式讓此演算法更準確。
 在應用方面,距離測度可以被使用在人臉識別、物體識別、音樂的相似性、手寫識別等領域。此外,在很多機器學習方法如K近鄰、Suport Vector Machine、徑向基函數網路等方法中,選擇一個好的距離測度方式也能提升模型的學習結果。


沒有留言:

張貼留言