2012年12月28日 星期五

Introduction to Distance Metric Learning


課程: 論文研討(一)
日期 : 2012/12/21
時間 : 13:50 ~ 15:30
學生 : 資傳研一  李金龍
演講者 : 海洋大學資訊工程學系 張欽圳

心得感想:
  這次演講的主要是在說明資料中的距離概念,其中有提到類別標籤連結資訊,還提到了區域度量和距離度量的一些說明,當然這些講解的內容都還包含了很多公式,其中還有三角不等式、向量的公式等等,當中還提到了計算這些會有個權重值,然後接著就講解利用權重去分類分群的一些方式等等當中也有提到的SVM、KNNR、CART等分類器。

大致上分類器會用到
1.relevant component analysis 
2.linear discriminant analysis 
3.margin - based approach 
4.generalized iterative relief 









圖片來源: 網路

海量資料:行動運算的最後一塊拼圖


課程: 論文研討(三)
日期 : 2012/12/28
時間 : 13:50 ~ 15:30
學生 : 資傳研二 陳冠宏
演講者 : 國網中心 王耀聰

心得報告:

        JAZZ是網路名人,在hadoop的領域裡面享有很高的名譽,今天為我們演講的題目既深又廣,深入淺出,詳細地說道雲端的開始和台灣目前缺少的部分到世界雲端的走向。JAZZ在分析之後說到目前我們台灣最缺乏的部分就是Software as a Service (SaaS) 軟體雲端服務 的供應商,所以題目才會訂為→海量資料:行動運算的最後一塊拼圖。

I. Software as a Service (SaaS) 軟體雲端服務

該服務主要提供消費者能使用服務商運行在雲端基礎設施上的應用程式服務。消費者可透過各種客戶端設備透過WEB瀏覽器等來連線使用。就「軟體即服務」而言,供應者安裝、管理及維護軟體,供應者不一定擁有軟體運作所需的實體基礎架構,消費者均無法接觸基礎架構,只能使用應用程式。

II. Platform as a Service (PaaS) 平台雲端服務

 PaaS用來提供給消費者在雲端基礎設施上部署消費者自行建立或採購的應用程式服務,這些應用程式服務主要使用雲端供應商所支援的開發語言或開發工具來開發。就「平台即服務」而言,供應者為平台管理雲端基礎架構(通常為特定應用程式類型的基礎架構),消費者的應用程式無法觸及平台背後基礎架構。

III. Infrastructure as a Service (IaaS) 架構雲端服務

IaaS則是提供了處理、儲存、網路以及其他雲端基礎設施的計算資源給用戶,藉以讓消費者自行部署或運行自己的軟體與服務,包含作業系統或應用程式等。就此模式而言,供應者維護儲存空間、資料庫、訊息佇列或其他中介軟體,或是虛擬機器所在的主機環境,消費者使用時,將服務當成硬碟、資料庫、訊息佇列或機器,但無法觸及其管理基礎架構。


Introduction to Distance Metric Learning


課程: 論文研討()
日期 : 2012/12/21
時間 : 13:50 ~ 15:30
學生 : 資傳研二 溫千力
演講者海洋大學資訊工程學系 張欽圳

心得報告:

   根據性質的同,必須此用不同的距離量測方式當觀察彼此間的距離值愈小,則表示個觀察體在某方面的相似性程愈高,反之則表示相似性程低。例如:資集是屬於二元變時,將資續型的資料來計算距矩陣適當必須依據各觀察是否具有變所定義的屬性觀察間的相似程,以集群分析。一般常用的距離種類有歐氏距離、曼哈頓距離、馬氏距離等。

    在機器學習演算法中,無論是分群還是分類,幾乎都會利用距離(Distance metric)作為判斷依據,讓電腦從大量分類或分群好的資料中去學習距離的定義,當新資料加入時可以利用學習出的距離定義將資料進行正確的分類或分群,常見的演算法有KNN(K-nearest neighbor)SVM(Support Vector Machine)RBF(Radial Basis Function Network)等。

Introduction to Distance Metric Learning


課程論文研討()

日期:2012/12/21
時間:13:50 ~ 15:30

學生:資傳研二 葉怡婷

演講者:海洋大學資訊工程學系 張欽圳教授
心得感想:
目前學界的研究大多是針對某種情況下的分類去做專精的研究,而此次的講者張教授給予了我們在參數權重調整上的一種概念。實驗中,不外乎的就是要蒐集數據,然後觀察數據,再調整權重,以使得數據合乎現實的狀況,從中發掘某些特性會是相對重要的,故而權重較重。然而,有些時候的狀況並不能使用傳統的角度做調整,此時只要將觀念稍微轉一下,或許就能得到很適切的答案。
例如:當一筆數據壓縮後,兩群體資料若有重疊,那麼這就會造成日後區分兩群體時的困難,因此,必須找出條線,讓兩個群體能夠分得非常清楚。如圖1
1:轉向分類
但也有更複雜的情況,則可以拋棄傳統的分類方式,使用空間上的距離計算。將同類的距離減小,不同類的距離加大。如此一來,便可將兩群體的距離拉開。中間不斷地進行找鄰居以及計算距離的跌代。直到兩個群體能夠清楚地分開。如圖2
2Margin-based approach
這次的演講比較偏重研究方面的權重設定,認真聽應該會蠻有收穫的,但是因為數學公式實在很複雜,讓我聽到一半就已經呈現半放棄狀態,但是大致上的概念還是很淺顯易懂,而且很適用在各類的研究中,值得參考。







2012年12月24日 星期一

Introduction to Distance Metric Learning

課程: 論文研討(一)
日期 : 2012/12/21
時間 : 13:50 ~ 15:30
學生 : 資傳研一 王健任
演講者海洋大學資訊工程學系 張欽圳

這次的演講是關於資料的分類與分群,在將資料分類或分群的領域中,經常會將資料轉換成向量來比對其距離來辨別其相似度,電腦可以透過學習來辨識各個資料之間的相似度。
而根據資料的不同需要使用不同的方式來將資料作換算,這取決於研究者對於資料所做的分類定義。一般來說換算出來兩筆資料的距離越小則越相似。反之則越不相似。
資料相似度的比對在很多方面上都有所運用,像是影像辨識,物體辨識,簽名辨識等。
希望未來能發展得更好。