2013年1月14日 星期一

Introduction to Distance Metric Learning


課程論文研討()
日期 : 2012/12/21
時間 : 13:50 ~ 15:30
學生 : 資傳研二 張焜翔
演講者 : 海洋大學資訊工程學系 張欽圳

心得報告:


在機器學習演算法中,無論是分群還是分類,幾乎都會利用距離(Distance metric)作為判斷依據,讓電腦從大量分類或分群好的資料中去學習距離的定義,當新資料加入時可以利用學習出的距離定義將資料進行正確的分類或分群,機器學習是近20多年興起的一門多領域交叉學科,涉及機率論、統計學、逼近論、凸分析、演算法複雜度理論等多門學科。機器學習理論主要是設計和分析一些讓計算機可以自動「學習」的演算法。機器學習演算法是一類從數據中自動分析獲得規律,並利用規律對未知數據進行預測的演算法。因為學習演算法中涉及了大量的統計學理論,機器學習與統計推斷學聯繫尤為密切,也被稱為統計學習理論。演算法設計方面,機器學習理論關注可以實現的,行之有效的學習演算法。很多推論問題屬於無程序可循難度,所以部分的機器學習研究是開發容易處理的近似演算法。
Maedche & Staab 2001) 針對本體論學習提出一個四階段架構,如上圖所示。第一階段為「引進與再利用」(import and reuse),主要是針對已經存在的本體論進行結構合併或定義映對(mapping)的規則,例如定義出本體的分類規則;第二階段是「萃取」(extract),利用Web的資源支援本體論的學習,進而建構出目標本體論的初步架構,例如根據本體的分類規則進行分類;第三階段是「修整」(prune),針對前兩階段結果進行目標本體論的修正,例如針對分類結果之確認分類架構之合適性並進行修正;第四階段則是「精練」(refine),使修正過的目標本體論更精細與目標主體更適配,例如針對修正過的分類架構建構更準確的分類結果。

沒有留言:

張貼留言