2013年1月14日 星期一

Bag of Block-Based Visual Words for Image Retrieving and Classification

課程: 論文研討(一)
日期 : 2012/11/16
時間 : 13:50 ~ 15:30
學生 : 資傳研一 邱文祥
演講者 : 義守大學資工系 郭忠民 教授

SIFT (Scale-Invariant Feature Transform)就是一種電腦視覺的演算法用來偵測描述影像中的局部性特徵,它在空間尺度中尋找極值點,並提取出其位置、尺度、旋轉不變數。若找兩影像的關鍵點特徵來比對,可發現越相似的影像,關鍵點特徵符合數越多,藉此來判斷兩影像的相似度。


演講者最後所使用方法使用了bag of words,以4×4區塊分割的方式擷取影像的特徵,還加入巨觀與微觀的概念,
建立出巨觀視覺字典與微觀視覺字典,最後在利用影像檢索來驗證視覺字典。
大致上簡單的圖像看起來結果都還不錯,複雜點的就開始有失誤的情況,所以還有待研究。

沒有留言:

張貼留言