2012年11月30日 星期五

Bag of Block-Based Visual Words for Image Retrieving and Classification


課程論文研討(一)
日期 : 2012/11/16
時間 : 13:50 ~ 15:30
學生 : 資傳研一 劉孝皇
演講者 : 義守資工系 郭忠民 教授

心得報告:一般的影像檢索系統是藉由類似特徵查詢到相似影像,而分類系統是影像對每個類別的特徵性質進行比對並分類到適合的類別裡。利用尺度不變特徵轉換(Scale-Invariant Feature Transform, SIFT)擷取特徵點並改良傳統SIFT無色彩特徵資訊後,訓練特徵點產生視覺字(Visual Word)去作為視覺描述子(Visual Descriptors)和比對精確效能的指標,由於SIFT對平滑背景部分無法有效擷取特徵,所以利用區塊特徵(KeyBlock)改善平滑背景部分無擷取特徵點而影響影像的比對。4×4區塊分割的方式來擷取影像內容具代表性的特徵,與SIFT相比較簡單容易且有效,並加入巨觀與微觀的概念,建立出巨觀視覺字典與微觀視覺字典,巨觀微觀字典以不同比例進行搜索時,可找到不同類型的照片,以相似性、差異性histogram(並非灰階值而是visual word)進行比對。ARRANMRR套用巨微觀不同權重比例的實驗結果顯示此研究所訓練的視覺字典具有描述能力,也進一步將視覺字典應用在影像分類上。雖然有少數結果錯誤,但之後將樣本增加的話相信在影像檢索的準確率能大幅提高。