2013年1月7日 星期一

Bag of Block-Based Visual Words for Image Retrieving and Classification


課程: 論文研討(三)
日期 : 2012/11/16
時間 : 13:50 ~ 15:30
學生 : 資傳研二 吳尚鴻
演講者 : 義守大學  資訊工程學系 郭忠民 教授

心得報告:這次演講請到義守資工系的郭忠民郭教授,來和我們分享圖片的檢索及分類。一般來說若我們要執行資料的檢索及尋找,關鍵字往往是搜尋的關鍵,若是關鍵字下的好,電腦在搜尋時多半都會回覆使用者正確的資料。但是有時候電腦在判斷上還是會出錯的,例如當使用者想要找"章魚"的圖片時,返回的資料或許會參雜著"魚"類的圖片,甚至還會回傳熱呼呼的"章魚燒"照片。為了避免餘字彙階段判斷發生歧異導致回傳結果發生錯誤,可以利用"視覺字"來進行圖片的檢索及分類。

所謂的視覺字,並非文字,而是許許多多簡單不複雜的圖片,將這些稱為視覺字的圖片集合起來形成視覺字資料庫,利用資料庫跟需要檢索及分類的圖片進行比對。利用這些圖片的特性來代表物件,進一步的達到檢索與分類的目的。例如;向日葵視覺字多半是以咖啡色的圓型為中心,而周圍為亮黃色或是橘色等特色。利用物件的特性來當作篩選及分類的依據。利用視覺字的檢索及分類確實可以除去搜尋時對於文字的判斷錯誤。

然而比對的方式就是把要檢索的圖片進行分割然後再比對,然而在圖片被分割後,發現這些分割後的各個小圖片其實十分有趣,由於一張圖片中顏色變化量大的地方往往是主角,是主要物件所在之處,所以在分割之後可以把背景及物件分離,這樣我們在物件的判斷及分類上可以更為清楚,而且也可以由背景大略判斷物件可能為何。

雖然對於影像的檢索及分類沒有許多的研究 ,但是聽郭教授說了之後淺顯易懂,沒想到對於圖片的搜索可以利用圖片來當作"關鍵字"搜索,讓我大開眼界,受益良多。



沒有留言:

張貼留言