2013年1月6日 星期日

Bag of Block-Based Visual Words for Image Retrieving and Classification


課程論文研討(一)
日期 : 2012/11/16
時間 : 13:50 ~ 15:30
學生 : 資傳研一 林智偉
演講者 : 義守資工系 郭忠民 教授

心得:

    今天的演講是關於影像處理還有圖片分析的部分,平常常見的圖片搜尋大部分都是以輸入關鍵字文字來搜尋想要的圖片,但這樣子會產生一些問題,例如所輸入的關鍵字不夠清楚的描述搜尋者想要搜尋的圖片或是表達較不清楚,又或者是可能圖片命名雖然是以該關鍵字命名,實際上卻不是搜尋者想要的圖片。

    所以為了解決這個問題,今天義守大學資訊工程系的郭忠民教授要演講的題目就是關於用「圖片」來搜尋「圖片」的技術與其會產生的問題與分析等等的主題,以解決關鍵字搜尋到不相干的圖片等問題,來提高圖片搜尋的精確率,在以「圖片」搜尋「圖片」的前題,必須先分析圖片的紋理特性,將紋理特性視為visual word,如同將圖片視為文件,以關鍵字進行搜尋感興趣的文件一樣,而visual word該如何表達以及採用的數量多寡界是需要思考的問題。

    在這邊講師有提到的技術像SIFT(Scale-invariant feature transform ),這個技術可以幫助辨識物體,是一種電腦視覺的演算法用來偵測與描述影像中的局部性特徵,它在空間尺度中尋找極值點,並提取出其位置、尺度、旋轉不變數,此演算法由 David Lowe 在1999年所發表,2004年完善總結。

    其應用範圍包含物體辨識、機器人地圖感知與導航、影像縫合、3D模型建立、手勢辨識、影像追蹤和動作比對。此演算法有其專利,專利擁有者為 英屬哥倫比亞大學SIFT 特徵是基於物體上的一些局部外觀的興趣點而與影像的大小和旋轉無關。 對於光線、雜訊、些微視角改變的容忍度也相當高。基於這些特性,它們是高度顯著而且相對容易擷取,在母數龐大的特徵資料庫中,很容易辨識物體而且鮮有誤認。

    使用 SIFT特徵描述對於部分物體遮蔽的偵測率也相當高,甚至只需要3個以上的SIFT物體特徵就足以計算出位置與方位。在現今的電腦硬體速度下和小型的特徵資料庫條件下,辨識速度可接近即時運算。SIFT特徵的信息量大,適合在海量資料庫中快速準確匹配。
但在資料庫中,如果資料庫資料量太大,會因為背景太多而導致偵測錯誤,所以在這邊研究不會採用此種方式

    最後是以分成許多區塊的方式來擷取影像內容具代表性的「特徵」來作分析,比SIFT更有效,並在搜尋時,可找到不同類型的照片,以相似性、差異性來比對。利用影像檢索來驗證訓練視覺字典,觀察其特徵描述子是否能正確的描述出影像,在影像分類這一個領域中是很重要的一環也能得到很好的結果。

沒有留言:

張貼留言