日期 : 2012/11/16
時間 : 13:50 ~ 15:30
學生 : 資傳研一 辛彥德
演講者 : 義守大學資工系 郭忠民 教授
對使用者而言,以圖片搜尋圖片往往較易於找到想要搜尋的圖片資料。目前也有許多相關的系統及網站。用圖像來進行搜尋時,必須先利用相關演算法來將圖像進行特徵化。而SIFT (Scale-Invariant Feature Transform)就是一種電腦視覺的演算法用來偵測與描述影像中的局部性特徵,它在空間尺度中尋找極值點,並提取出其位置、尺度、旋轉不變數。若找兩影像的關鍵點特徵來比對,可發現越相似的影像,關鍵點特徵符合數越多,藉此來判斷兩影像的相似度。
SIFT可用來偵測與描述影像中的局部性特徵,它在空間尺度中尋找極值點,並提取出其位置、尺度、旋轉不變數,局部影像特徵的描述與偵測可以幫助辨識物體,對於光線、雜訊、些微視角改變的容忍度也相當高。基於這些特性,它們是高度顯著而且相對容易擷取,在母數龐大的特徵資料庫中,很容易辨識物體而且鮮有誤認。但會因為背景而導致偵測錯誤,因此研究不採用SIFT。
研究以4×4區塊分割的方式來擷取影像內容具代表性的特徵,與SIFT相比較簡單容易且有效,並加入巨觀與微觀的概念,建立出巨觀視覺字典與微觀視覺字典,巨觀微觀字典以不同比例進行搜索時,可找到不同類型的照片,以相似性、差異性histogram(並非灰階值而是visual word)進行比對。利用影像檢索來驗證訓練視覺字典,觀察其特徵描述子是否能正確的描述出影像,以ARR與ANMRR的實驗結果顯示此研究所訓練的視覺字典具有描述能力,也進一步將視覺字典應用在影像分類上。
沒有留言:
張貼留言