2013年4月29日 星期一

Visual Saliency for Image Segmentation and Object Detection


課程: 論文研討()
日期 : 2013/04/26
時間 : 13:50 ~ 15:30
學生 : 資傳研二 溫千力
演講者 :中央研究院  劉庭祿研究員

心得報告

Graph cut可在有向圖或無向圖的把節點分割成兩群。最常在解決有向圖中,由源點(source)流向匯點(sink)的流量問題,例如:水管、網路或車流量。在近幾年影像被建立成圖學概念,使得影像可被建成無向圖,因此graph cut被用來解決電腦視覺、圖像處理以及機器學習的問題,其中的問題包括影像分割、影像分類以及影像合成。
最大流量問題:Graph cut所使用最大流量最小割定理把圖上的節點相關性高的分割在一起。相關性高的節點能夠互相流通,也就是水管殘留的容量高,反之,相關性低的節點互相流通的流量很低,也就是水管殘留的容量低。最小割就是把殘留的容量低的水管切割,以達到分割兩群,此兩群內的節點之間的相關性高。要找到殘留的容量最低的水管不容易,但找到最大流量時的狀況會為水管殘留的容量最小的時候,於是最大流量最小割定理便先找到最大流量時,切割殘留的容量最低的水管。
    利用眼球追蹤觀察使用者關注在哪些區域(Visual Saliency)以產生Saliency map,並且在影像上框出多個window計算是否存在Saliency object,最後利用Graph cut將影像前景與背景分割。此研究可利用多張影像可自動進行分割(fully unsupervised),將影像oversegment分成300~400superpixel (decompose image),使用Energy functiony再比較任兩張影像的前景是否相似,以此達到自動分割之目的。

沒有留言:

張貼留言