課程:論文研討(三)
日期:2012/11/16
時間:13:50 ~ 15:30
學生:資傳研二 葉怡婷
演講者:義守大學 資工系 郭忠民教授
心得:
目前的搜尋都是利用影像本身的特徵做檢索,例如紋理、顏色、形狀。而檢索完之後會再做分類的動作,但目前尚未有好的分類方式,因此,找到的資料往往都不符合使用者的需求。因此,目前希望能夠發展文字的檢索:利用文字描述畫面感受。
常常,人類對於同一張的影像會有類似的感受,因此,對於同一張圖片常常會出現相同的文字敘述,所以,若能夠用這種「文字」的方式做檢索的動作,或許能夠提高查詢成功率。
Bag of “Word” 提出的方式是,而”Word”指的就是圖片。利用簡單的圖片分塊狀來做比對。然而雖然是利用簡單的分割,但比對方面就顯得簡單許多,所以效果和效率上也會比較優。
而類別的分類比檢索困難,由於特徵的選擇會決定分類項目,因此,在觀察之後,決定利用巨觀和圍觀的方式描述建立字典。巨觀的定義為:大部分,不太會變動的場景或物品。然而,比對之後發現,圍觀的字典裡面包含大部分的巨觀字典,再加上利用word的方式比對,word與word之間並不會有太大的相似性,因此可以透過histogram(直方圖)的方式比對。
實際做過實驗之後發現,他們提出的方法在檢出率(ARR)以及檢出序(ANMRR)都有比傳統的效果好,而且實際分類出來的解果,錯誤率也降低了。
複雜的問題都是由簡單的問題延伸而來的,因此,通常能夠利用簡單的方式解決,只是一般時候我們都已經陷入在複雜的思考裡。也許,回歸簡單思考會是一個不錯的方式。
沒有留言:
張貼留言