資傳系論文研討專用區: Bag of Block-Based Visual words for Image Retrieving and Classification

課程：論文研討(三)

日期：2012/11/16

時間：13:50 ~ 15:30

學生：資傳研二葉怡婷

演講者：義守大學資工系郭忠民教授

心得：

目前的搜尋都是利用影像本身的特徵做檢索，例如紋理、顏色、形狀。而檢索完之後會再做分類的動作，但目前尚未有好的分類方式，因此，找到的資料往往都不符合使用者的需求。因此，目前希望能夠發展文字的檢索：利用文字描述畫面感受。

常常，人類對於同一張的影像會有類似的感受，因此，對於同一張圖片常常會出現相同的文字敘述，所以，若能夠用這種「文字」的方式做檢索的動作，或許能夠提高查詢成功率。

Bag of “Word”　提出的方式是，而”Word”指的就是圖片。利用簡單的圖片分塊狀來做比對。然而雖然是利用簡單的分割，但比對方面就顯得簡單許多，所以效果和效率上也會比較優。

而類別的分類比檢索困難，由於特徵的選擇會決定分類項目，因此，在觀察之後，決定利用巨觀和圍觀的方式描述建立字典。巨觀的定義為：大部分，不太會變動的場景或物品。然而，比對之後發現，圍觀的字典裡面包含大部分的巨觀字典，再加上利用word的方式比對，word與word之間並不會有太大的相似性，因此可以透過histogram（直方圖）的方式比對。

實際做過實驗之後發現，他們提出的方法在檢出率（ARR）以及檢出序（ANMRR）都有比傳統的效果好，而且實際分類出來的解果，錯誤率也降低了。

複雜的問題都是由簡單的問題延伸而來的，因此，通常能夠利用簡單的方式解決，只是一般時候我們都已經陷入在複雜的思考裡。也許，回歸簡單思考會是一個不錯的方式。

資傳系論文研討專用區

網頁

2012年11月16日星期五

Bag of Block-Based Visual words for Image Retrieving and Classification

沒有留言:

張貼留言

網頁

2012年11月16日 星期五

Bag of Block-Based Visual words for Image Retrieving and Classification

沒有留言:

張貼留言

2012年11月16日星期五