2013年4月28日 星期日

Exploring Visual Saliency for Image Segmentation and Object detection


課程:論文研討()
日期:2013/04/26
時間:13:50 ~ 15:30
學生:資傳研二 葉怡婷
演講者:中央研究院資訊所 劉庭祿研究員
心得報告:
此次的議題是探討有關視覺顯著影像切割和目標檢測,目前在影像處理系列的研究,物件的標示及追蹤仍舊是一大重點,若能夠準確的標出物件,對於後續的利用及判斷都具有極大的影響。
在正式進入演講的重點之前,劉博士介紹了一個目前在影像處理界常用的技術─Graph Cut,這是一種能夠輕鬆將前景及背景分開的方法。一般的圖都會有點,點和點之間有線(有向無向皆可),每條線可以賦予權重值,而Graph Cut的圖還會再賦予兩個點SSource)和TSink),圖上的每個點將會依照最小分割原理被分成兩組(ST)。也就是說:兩點之間的變化愈大=相似程度愈小=損失函數E(A) 愈小,也就能夠依照最小切割原理將此兩點之間的線切斷,如此一來,即可分出前景及背景。
一般來說,目前在擷取物件時遇到的困難點就是物件的邊緣無法連續或是區塊不完整,在我們自己的研究中,可利用膨脹收縮的方式將影像中的區塊成為一個完整的封閉區塊,而此次議題所使用的方式,是將影像偵測前十次重疊區域最高的地方聯合起來,成為一個較大的區塊。另外,我們的研究使用視覺追蹤系統來了解閱聽者關注的區域,然而此次議題卻是讓電腦自動判斷出閱聽者最有可能觀看的區域。此種方式是利用物體邊界Saliency較高做判斷,因此能夠結合目標檢測和影像切割,使得電腦能夠在沒有任何條件下進行多張圖像的前景(大部分人會看的地方)及背景切割。
依此方式能夠獲得大部分人觀看區域的資訊,但卻並無法使用在特殊的情況下(例如:自閉症閱讀情況、過動兒專注度問題),因此,Eye Tracking,仍有其得利之處。不過若能夠依此方式準確地將大部分閱聽者會看的地方判斷出來,就更能夠節省成本及校正問題。

沒有留言:

張貼留言