2013年1月17日 星期四

User Behavior Modeling and Prediction by Mining Multiple Information Sources in Mobile Social Network Space



課程論文研討()
日期 : 2013/01/04
時間 : 13:50 ~ 15:30
學生 : 資傳研二 陳怡安
演講者 : 成功大學 曾新穆教授

心得報告:

這次主題是利用資料探勘(Data Mining)技術,以社群網路為對象,分析這些社群網路使用者的行為,並藉此發掘可能存在的商機

資料探勘(Data Mining),又譯為數據挖掘、資料採礦。它是資料庫知識發現(英語:Knowledge-Discovery in Databases,簡稱:KDD)中的一個步驟。資料探勘一般是指從大量的資料中自動搜尋隱藏於其中的有著特殊關聯性(屬於Association rule learning)的訊息的過程。資料挖掘通常與電腦科學有關,並通過統計、在線分析處理、情報檢索、機器學習、專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現上述目標。

其核心技術包含關聯(Association)、分類(Classification)、叢集(Clustering)、因果(Sequencing)



2013年1月16日 星期三

User Behavior Modeling and Prediction by Mining Multiple Information Sources in Mobile Social Network Space

課程:論文研討(三)
日期:2013/01/04
時間:13:50 ~ 15:30
學生:資傳研二 吳尚鴻
演講者:成功大學 曾新穆教授

心得報告:
今天的演講者和我們分享有關於資料探勘,資料探勘別名為資料採礦,資料探勘的意義就如別名的字面意思一樣,在許許多多的資料之中找到一些可用的資訊,其實就是資料探勘的主要精神。其實身邊很多例子跟資料探勘都有關係,例如到賣場的時候,可以發現生鮮肉品旁邊的架子大部分會擺調味料,這是由於經由統計,大部分買完肉品的人會買調味料,所以就擺在一起。

然而由於行動個人網路及智慧型手機的發展,所以個人社交網路越來越多人加入了,相當有名的例子當然就屬FB(Facebook)、twitter。有使用過FB的使用者,可以發現有許多推薦社團或是"你可能認識的人",我想或許就是經過資料探勘過後統整出來的資訊善加利用後的功能。

當然曾教授也提到,不只在雲端資料庫的資料可以做資料探勘,在持有終端設備使用者其實也可以進行資料探勘,利用的則是手機的感測器,曾教授提出了簡單的例子,其實收集感測器的資料就可以判別出使用者的性別,且95%的正確率,原因是因為男性都把手機放在口袋,而女性大部分都把手機放在包包內,然後感測器偵測到的震動就會明顯的不同,這也是經過資料探勘後得到的資訊。然後透過這些資訊就可以做成模型,或是做些預測或是服務。

在我的研究過程中,有一種由定位延伸的服務,叫做適地性服務,就是統計使用者常去的地方,或是消費習慣,去提供使用者適合的服務。利用資料探勘其實可以找出一些東西,感覺好想收集而成的資料會說話一般。

海量資料:行動運算的最後一塊拼圖

課程論文研討()
日期 : 2012/12/28
時間 : 13:50 ~ 15:30
學生 : 資傳研 吳尚鴻
演講者 : 國網中心 王耀聰
 
心得感想:
隨著科技的發展,以及網路的速度越來越快,資料的流動越來越頻繁了。由於網路型態的改變,使得雲端運算這個概念被提了出來,一些網路的龍頭,例如:Google,也極力的在推廣一些雲端的服務,想要拓展雲端的發展。而在雲端大量的資料存取以及計算下,也產生了一個新的專有名詞-海量資料。
 
由於資料量從以前的KB、MB、GB變成現在TB,甚至是ZB,資料以前的數萬。這是因為雲端提供了每個使用者的存取,讓資料的流量積少成多形成海量資料,當然要處理這麼大量的資料,就是行動運之後要面臨的挑戰了。
 
當然海量資料要做資料的探勘是有些困難的,尤其資料量眾多,又要在短時間內找到特定資料的情況下,但只要能夠對海量資料做適當的分析,也可以從資料中找到些有趣的結果,例如:會使用系統的使用者的職業,年齡...等等,我認為在未來,能夠分析海量資料的人才是市場上不可或缺的。

Bag of Block-Based Visual Words for Image Retrieving and Classification

課程: 論文研討()
日期 : 2012/11/16
時間 : 13:50 ~ 15:30
學生 : 資傳研二 楊鈞浩
演講者義守資工系 郭忠民 教授


以 Google 來說只要發佈文章就可以搜索的到因為它所採用的軟體核心技術是PageRank, 如同個別網頁價值的指示器,透過龐大的連結架構來信賴網站獨特地民主性質。當然,Google 會查看票數來源,或是連結網頁接收的票數;同時它也會分析參予投票的網頁。透過「重要的」網頁來參予投票,並且幫助其它的網頁也成為「重要的」網頁資料。

重 要、優質的網站會得到較高的 PageRank,同時 Google 會記住每次所處理的查詢情況。當然,如果查詢出來的網頁結果並不符合您的需求,重要的網頁對您也不具任何意義。
Google是設計來排列雜亂資料的先後順序。只要是有其他連結引用到的網頁,Google 就會收集到它。Google 會分析每個連結與其他網頁的連接方式,利用網際網路開放、龐大的特性產生最相關的搜尋結果。

資通信與雲端運算發展之探討


課程: 論文研討()
日期 :
2012/12/7
時間 : 13:50 ~ 15:30
學生 : 資傳研二 楊鈞浩
演講者
中華電信總公司客服處處長 簡志誠

雲端運算,是一種基於網際網路的運算新方式,透過網際網路上異構、自治的服務為個人和企業使用者提供按需即取的運算。由於資源是在網際網路上,而在電腦流程圖中,網際網路常以一個雲狀圖案來表示,因此可以形象地類比為雲端,雲端同時也是對底層基礎設施的一種抽象概念。雲端運算的資源是動態易擴充套件而且虛擬化的,透過網際網路提供。終端使用者不需要了解「雲端」中基礎設施的細節,不必具有相應的專業知識,也無需直接進行控制,只關注自己真正需要什麼樣的資源以及如何透過網路來得到相應的服務。雲端運算可以認為包括以下幾個層次的服務:基礎設施即服務(IaaS),平台即服務(PaaS)和軟體即服務(SaaS)。雲端運算服務通常提供通用的透過瀏覽器存取的線上商業應用,軟體和資料可儲存在資料中心。

Introduction to Distance Metric Learning

課程: 論文研討()
日期 : 2012/12/21
時間 : 13:50 ~ 15:30
學生 : 資傳研二 楊鈞浩
演講者海洋大學資訊工程學系 張欽圳

 資料探勘是一種資料分析技術,儘管提供了資料多維度分析和決策輔助的功能,但我們需要在現存的大量資料中進行更深一層的分析,將這些資料轉換成有用的資訊和知識,資料探勘的出現就是為了滿足這樣的需求,是近幾年來相當熱門的一個研究領域。資料探勘已有一些成熟的技術並運用在各種不同的應用上,例如銷售管理、生產控制、市場行銷分析等。
資料的相似度測量,可以先將資料量化,並且用不同的測量方式,測量資料彼此間的距離,如果越近就代表資料越相似,如果越遠就代表資料的差異性大。簡單的說就是把『相似』的的東西找出來,介以用來分析一些東西。

海量資料:行動運算的最後一塊拼圖

課程: 論文研討()
日期 : 2012/12/28
時間 : 13:50 ~ 15:30
學生 : 資傳研二 楊鈞浩
演講者國網中心 王耀聰







海量資料的處理,最早的技術是網格運算,網格運算成立當時,電腦的成本還是相當的昂貴,所以,學術研究人士透過Internet串連數其它志願者的電腦,進行了第一次的雲端運算,而如何讓大量的資料以智慧化的方式服務人類是重要課題,而雲端的處理過程就是其中一項,把資料存在於雲端上方便使用者的存取,而他的趨勢也是跟著硬體在演化的。

User Behavior Modeling and Prediction by Mining Multiple Information Sources in Mobile Social Network Space

課程: 論文研討()
日期 : 2013/01/04
時間 : 13:50 ~ 15:30
學生 : 資傳研二 楊鈞浩
演講者成功大學 曾新穆教授


因為網路上的資料慢慢增多,如何在龐大的網路資訊中,快速的找到使用者需要的資料是個很重要的課題,資料探勘的技術就是在幾應映而生,關聯(Association)、分類(Classification)、叢集(Clustering)、因果(Sequencing)四大類,先將資料和使用者分堆分群,以關鍵字來代表一個文件資料,並利用關聯法則把相關性高的資料過濾出來給使用者。如果合一些攜帶方便的硬體,人們將會更方便

2013年1月15日 星期二

User Behavior Modeling and Prediction by Mining Multiple Information Sources in Mobile Social Network Space

課程:論文研討(三)
日期:2013/01/04
時間:13:50 ~ 15:30
學生:資傳研二 劉浩瑋
演講者:成功大學 曾新穆教授

心得:
語意網路與資料探勘透過社群網路結合囉囉囉
打造善解人意的行銷手段就靠他們了唷唷唷

資料探勘:資料探勘一般是指從大量的資料中自動搜尋隱藏於其中的有著特殊關聯性(屬於Association rule learning)的訊息的過程。

語意網路:透過給全球資訊網上的文件 (如: HTML)添加能夠被電腦所理解的語意(Meta data),從而使整個網際網路成為一個通用的訊息交換媒介。語意全球資訊網透過使用標準、標示語言和相關的處理工具來擴充功能全球資訊網的能力。

語意網路+資料探勘=大概就是這種感覺

Bag of Block-Based Visual Words for Image Retrieving and Classification

課程: 論文研討(三)
日期 : 2012/11/16
時間 : 13:50 ~ 15:30
學生 : 資傳研二 劉浩瑋
演講者 : 義守大學資工系 郭忠民 教授

心得:
這次的主題是關於圖像搜尋的介紹
以前是以文搜圖
現在有了以圖搜圖後
可以不用煩惱怎樣打關鍵字想要的東東才會跳出來
雖然的命中率還有加強空間...
這功能主要是看圖像紋理
利用一堆神奇的數學公式
只要憑著畫面的圖片就能找到差不多的
另外影像處理技術SIFT(Scale-invariant feature transform)
這是使用電腦演算法來偵測影像中的局部特性
並在空間尺度中尋找極值點提取出位置、尺度、旋轉不變數
而這項技術的應用範圍包括物體辨識、機器人地圖感知與導航、影像縫合、3D模型建立、手勢辨識、影像追蹤和動作比對。
一堆像的裡面還是有一堆不像的

Introduction to Distance Metric Learning

課程: 論文研討(三)
日期 : 2012/12/21
時間 : 13:50 ~ 15:30
學生 : 資傳研二 劉浩瑋
演講者 : 海洋大學資訊工程學系 張欽圳

心得:

距離度量演算法
無論是分群還是分類都會利用到距離度量
讓電腦從大量分類或分群好的資料中去學習距離的定義
當新資料加入時可以利用學習出的距離定義將資料進行正確的分類或分群
機器學習理論主要是設計和分析一些讓計算機可以自型學習的演算法
根據根據不同的資料,可以使用不同的測量方式
透過各種函式運算讓機器進行訓練距離測度學習
讓辨識變的更加準確
而這項技術可以放在人臉識別、物體識別、音樂的相似性、手寫識別的應用上
算臉的相似度來辨識喔喔喔~~~!!!

PTT報告-虛擬學習環境應用,促進學生應用能力

3d from a25629470

2013年1月14日 星期一

User Behavior Modeling and Prediction by Mining Multiple Information Sources in Mobile Social Network Space


課程論文研討(一)
日期 : 2013/01/04
時間 : 13:50 ~ 15:30
學生 : 資傳研一 朱宏昇
演講者 : 成功大學 曾新穆教授


心得報告:

 這次的主題是關於在社交網路中使用資料探勘以了解使用者行為,資料探勘是指在大量的資料中自動搜索隱藏於其中的關連。資料探勘必須透過統計、再現分析處理、情報檢所、機器學習、專家系統、模式識別來實現。這項技術使我們可以在大量的資料中比對出我們所需的相關資料,而其主要的技術有四類關聯(Association)、分類(Classification)、叢集(Clustering)、因果(Sequencing)

 

一般而言,Data Mining功能可包含下列五項功能:
 ‧分類(classification)
 ‧推估(estimation)
 ‧預測(prediction)
 ‧關聯分組(affinity grouping)
 ‧同質分組(clustering) 

 

而資料探勘有許多實例應用如:

1. 資料探勘在零售業的應用:
分店設點區位分析、銷售產品組合分析、促銷商品組合分析等等。

2.資料探勘在金融業的應用:
信用卡客戶信用評等、客製化金融服務、授信利率額度決策等等。

3.資料探勘在製造業的應用:
生產良率分析、庫存因素分析、物流整合及配置輔助決策等等。

4.資料探勘在醫療業的應用:
院內感染分析、臨床病徵分析、基因定序等等。

海量資料:行動運算的最後一塊拼圖


課程論文研討(一)
日期 : 2012/12/28
時間 : 13:50 ~ 15:30
學生 : 資傳研一 朱宏昇
演講者 : 國網中心 王耀聰

心得報告:

 這次的主題是關於海量資料IBM對於海量資料的定義是: 我們每天建立 2.5 百萬兆位元組的資料數量之多,光是過去兩年所建立的資料就佔當今世界總量的 90%。 這些資料來源廣泛, 像是用於搜集氣候資訊的感應器、社交媒體網站的貼文、數位圖片與影像、採購交易記錄以及行動電話 GPS 訊號等,不一而足, 這類的資料就是 海量資料

 而在未來我們必須面對的就是好好處理這些大量的資料,其提出的控管方式有: 數量控管、權限控管、品質控管。

 而和海量資料息息相關的辨識雲端運算,在雲端的發展趨勢下及可隨時隨地的控管並存取我們的資料,其發展在未來必定相輔相成。

Introduction to Distance Metric Learning


課程論文研討(一)
日期 : 2012/12/21
時間 : 13:50 ~ 15:30
學生 : 資傳研一 朱宏昇
演講者 : 海洋大學資訊工程學系 張欽圳

心得報告:

 今天的主題我想應該是與影像處理較有關係,演講者提到的是距離測度學習。主要是在說根據不同的資料,所以必須使用不同的測量方式。透過各種函式運算讓機器進行訓練距離測度學習,讓辨識變的更加準確。而這項技術可以應用在人臉識別、物體識別、音樂的相似性、手寫識別等領域。

資通信與雲端運算發展之探討

課程論文研討(一)
日期 : 2012/12/7
時間 : 13:50 ~ 15:30

學生 : 資傳研一 朱宏昇
演講者
 : 中華電信總公司客服處處長 簡志誠



心得報告:
 今天進行介紹的是中華電信的簡先生,主題是關於雲端運算。雲端的概念是讓使用者不必在自己的電腦上使用資源,而是在遠端的伺服器上進行運算。

雲端的五大基礎特徵是:
1. 隨需自助服務
2. 隨時隨地使用任何網路裝置存取
3. 多人共享資源
4. 快速重新佈署靈活度
5. 可被監控與量測的服務

雲端的四大佈署:
1. 公有雲
2. 私有雲
3. 社群雲
4. 混和雲

雲端的三種服務則是:

1. Software as a Service   軟體即服務
2. Platform as a Service    平台即服務
3. Infrastructure as a Service   架構即服務

這三種規律稱為雲端五四三,及現在對於雲端的解讀。

Bag of Block-Based Visual Words for Image Retrieving and Classification


課程: 論文研討(一)
日期 : 2012/11/16
時間 : 13:50 ~ 15:30
學生 : 資傳研一 朱宏昇
演講者 : 義守大學資工系 郭忠民 教授

心得報告:
 這次的主題是關於圖像搜尋的介紹,由於不是我的磚們領域,所以只能大概說明所聽到的東西。
 這次提到的是以圖搜圖,就我所知,過去的以文字搜圖要找到自己想要的東西其實並不容易。除非你對於想搜尋的東西有相當的理解並下了正確的搜尋標題,同時還必須有其他人有相同的理解,才有可能搜尋到想要的圖片。而「圖」搜「圖」,搜尋引擎則可以利用圖片特徵進行網路上的圖片比對,並且找出相似的圖片,這樣的準確率也許還有待加強,但是相較於文字搜尋已經準確許多。圖搜圖所應用到的是搜尋穩理特性,所以只要找到相似的圖片及呈現解果。但是依照我使用Google的圖搜圖功能的經驗,我認為圖片的顏色區塊占了滿大的部分的搜尋條件。Google的搜尋引擎若非找到相同圖,則會找尋相似顏色分布的圖片。
 另外演講者提到了一種影像處理技術SIFT(Scale-invariant feature transform)尺度不變特徵轉換,這是使用電腦演算法來偵測影像中的局部特性,並在空間尺度中尋找極值點提取出位置、尺度、旋轉不變數。而這項技術的應用範圍包括物體辨識、機器人地圖感知與導航、影像縫合、3D模型建立、手勢辨識、影像追蹤和動作比對。

寬頻真相大公開

寬頻真相大公開
課程: 論文研討(一)
日期 : 2012/10/26
時間 : 13:50 ~ 15:10
學生 : 資傳研一 朱宏昇
演講者 : 中華電信數據通信分公司網際網路處 吳雲鼎


心得報告:
 這次的演講感覺像是替中華電信的網路為什麼這麼貴,還有速度為什麼會這麼慢在進行消毒。為什麼會給我這種感覺呢,主要是因為吳先生在進行解釋中華電信營運方式時中間的問答還必須經過長官的指示後才能決定能不能解釋。似乎是有所隱瞞?
 另一點,在說明客戶端的速度問題時,吳先生提到的都是用戶端的問題,而在品質上卻說中華電信的品質無敵好。而我感覺到的就只是由於電信業者的獨大,導致台灣網路的發展以及價格出現不成比例的關係。其中的利害關係,則不再多做贅述。

以深度影像及三維樣板比對

資通信與雲端運算發展之探討


課程: 論文研討(一)
日期 : 2012/12/7
時間 : 13:50 ~ 15:30
學生 : 資傳研一 劉健興
演講者 : 中華電信總公司客服處處長 簡志誠

這次的演講主要在講這幾年來很熱門的雲端,提到有關目前對於雲端的分類,大致可以分成下列幾種;

1.公用雲:
由第三方提供給大眾或公司企業使用的雲端設施,透過租借的方式提供給客戶使用雲端服務,公用雲的好處是硬體和主機由第三方提供,所以較簡單和便宜,有擴展性,容易滿足使用者的需求,出多少錢有多少空間,所以沒有資源浪費。

2.私有雲:
雲端設施建立在防火牆內,白話來說就是個人企業或機構提供給內部使用。

3.混合雲:
至少一個私有雲加上一個公用雲,提供兩種方法:
(1)合作夥伴關係,混合雲供應商和私有雲或公共雲供應商的合作
(2)內部資源和服務的提供,使用混合雲的話可以讓企業有私有雲管理自身內部資料,又可以有公用雲提供服務

自動光學檢測技術與職場經驗分享

課程: 論文研討(一)
日期 : 2012/10/19
時間 : 13:50 ~ 15:30
學生 : 資傳研一 林智偉
演講者 宏瀨科技 詹方


心得報告:

 這次的主題主要提到了AOI(Automated Optical Inspection),意思是自動光學檢查,使用光學影像及影像比對檢測技術進行產品的檢測。針對輕薄短小、密度高之電子產品的檢測需求而開發,在不需測試治具、不需電子量測且不破壞產品的情況下,可有效檢出元件的各種不良製程。
 而使用AOI的效益除了可避免傳統人工目檢的不穩定因素,亦可加速檢測時間,有效為產品的品質把關,提高產能及減少生產、維修成本。
 AOI的用途很廣泛,如: 國防、民生、醫療、環保、電力

技術規格
1. 完整行程須在60 秒內(甚至更短)
2. 錯誤判斷發生率的降低(避免操作人員的重複檢查)
3. 盡可能的減少稼動損失(例如減少交換被檢查單元的時間)
4. 提高模糊比對的功能
5. 影像解析度不斷提高
6. 可檢測出週邊線路(以往只需要檢測面板內部)
7. 可儲存面板的瑕疵影像
8. 自動分類瑕疵

IoT Multimedia Platform and Advanced Applications

課程: 論文研討(一)
日期 : 2012/10/05
時間 : 13:50 ~ 15:30
學生 : 資傳研一 朱宏昇
演講者 : 陳俊良 教授


心得報告:
 這次提到的主題是IOT,也就是Internet of Things物聯網,這次提到的東西很有趣,由於現今的行動裝置和電腦網路的普及,人們開始構想未來任何東西都可以藉由網路進行控管的概念,從家電、車輛、建築物等等的所有東西讓人與物直接進行交流,而這樣的演進過程中將會需要各式各樣領域的技術及科技創新來帶動,小從奈米科技、大至城市無線網路的佈建,其影響範圍相當廣泛。
 從發展趨勢來看,物聯網的發展可分為「時間」(Time)、「地點」(Place)與「物件」(Thing)三個維度,隨著物聯網發展的趨於成熟將創造出所有物件皆可在任何時間、任何地點相互溝通的環境。其涵蓋了「人與人」、「物件與物件」及「人與物件」三大範疇如下圖




From Relational Databases to Distributed/Parallel Databases to cloud Databases


課程: 論文研討(一)
日期 : 2012/09/28
時間 : 13:50 ~ 15:30
學生 : 資傳研一 朱宏昇
演講者 : 陳良弼


心得報告:
 這次演講的主題是關於資料庫的應用,主要提到了幾項資料庫,其中讓我印象比較深刻的是Microsoft SQL ServerNoSQL(Not only SQL)的差別。
 Microsoft SQL Server就是傳統的關聯式資料庫,是建立在關聯模型基礎上的資料庫,藉助於集合代數等數學概念和方法來處理資料庫中的資料。NoSQL(Not only SQL)是使用分散式的資料庫系統,分散式資料庫有幾項優點: 反映組織架構、自主性、網路流量並且可漸進擴充,但資料的保密性及安全性則必須進行加強。
 最後還提到了雲端運算,雲端運算提供了使用者一個在遠端運算的能力,讓使用者不要耗費大量在個人電腦上的資源。

Performance Improvement and Analysis for Data Privacy of Cloud Computing Documents

User Behavior Modeling and Prediction by Mining Multiple Information Sources in Mobile Social Network Space


課程論文研討()
日期:2013/01/04
時間:13:50 ~ 15:30
學生:資傳研二 張焜翔
演講者:成功大學 曾新穆教授
心得感想:

很多趨勢大師都說未來的技術是決定在語意網路與資料探勘,雖然這兩種技術是兩回事,但有其共同點,更重要的是要解決的問題是一樣的。但說真的,有多少人去了解資料探勘真正的意涵呢?他跟一般的統計因子分析的方法到底有甚麼不同呢?或者說該如去設計應用或實作出來呢?許多人還停留在一知半解與道聽途說的狀態,以及語意網路真的可以帶給我們生活模式的不一樣呢?在這邊來嘗試著作一些解答…
有些人認為資料探勘,就是不再以個人的背景(Profile)資訊去判斷,例如年齡,性別,收入,學歷等等固定的因子來決定的差異,事實上真正的資料探勘不是因子分析也不是條件判定,而是在於物件(Object)之間的距離(Distance)或關係(Relationship)

傳統的行銷學有兩種方法,一種是找到對象,而這對象用的就是背景資訊去篩選定義,只是這背景選項再多也是相當有限,即使把年齡級距分得再細,收入階級分得再多,地區切割的更密,怎樣還是有相同的人,雖然如何區分兩個背景資料相同的人,但事實上他們要的東西不一樣,在傳統行銷並不重要,因為真正的重點是把透過廣告去"加強"商品的型像,讓每一個人想要你的商品,這才是對的另一種切入點.

海量資料:行動運算的最後一塊拼圖 From WSN to Mobile Computing, Big Data: The Missing Pussle


課程論文研討()

日期:2012/12/28
時間:13:50 ~ 15:30

學生:資傳研二 張焜翔

演講者:國網中心 王耀聰
心得感想


行動運算的快速興起,已成為驅動產業發展的重要動能。相較於Mac/Windows PC花了八年才達到2000萬台出貨量的里程碑,iOSAndroid裝置卻只花了兩年就達到這個目標。隨著行動上網的應用與功能日益多元,消費者需要行動裝置能支援多工作業與Flash技術,提供快速上網、觀賞電影、玩遊戲、存取各種內容等多種用途。
隨著超級手機和平板電腦的行動運算趨勢興起,消費者將更依賴透過雲端存取資料與應用程式。未來510年,許多消費者將完全捨棄使用實體的CD/DVD,甚至是硬碟。取而代之的是,隨時將所需內容串流至終端裝置。在YouTube上看影片就是最好的例子。在雲端環境中,對運算的需求更高,不僅終端裝置需要處理壓縮和解碼等作業,伺服器也需要提升效能才能處理雲端應用的需求,特別是處理繪圖運算的應用。


Introduction to Distance Metric Learning


課程論文研討()
日期 : 2012/12/21
時間 : 13:50 ~ 15:30
學生 : 資傳研二 張焜翔
演講者 : 海洋大學資訊工程學系 張欽圳

心得報告:


在機器學習演算法中,無論是分群還是分類,幾乎都會利用距離(Distance metric)作為判斷依據,讓電腦從大量分類或分群好的資料中去學習距離的定義,當新資料加入時可以利用學習出的距離定義將資料進行正確的分類或分群,機器學習是近20多年興起的一門多領域交叉學科,涉及機率論、統計學、逼近論、凸分析、演算法複雜度理論等多門學科。機器學習理論主要是設計和分析一些讓計算機可以自動「學習」的演算法。機器學習演算法是一類從數據中自動分析獲得規律,並利用規律對未知數據進行預測的演算法。因為學習演算法中涉及了大量的統計學理論,機器學習與統計推斷學聯繫尤為密切,也被稱為統計學習理論。演算法設計方面,機器學習理論關注可以實現的,行之有效的學習演算法。很多推論問題屬於無程序可循難度,所以部分的機器學習研究是開發容易處理的近似演算法。
Maedche & Staab 2001) 針對本體論學習提出一個四階段架構,如上圖所示。第一階段為「引進與再利用」(import and reuse),主要是針對已經存在的本體論進行結構合併或定義映對(mapping)的規則,例如定義出本體的分類規則;第二階段是「萃取」(extract),利用Web的資源支援本體論的學習,進而建構出目標本體論的初步架構,例如根據本體的分類規則進行分類;第三階段是「修整」(prune),針對前兩階段結果進行目標本體論的修正,例如針對分類結果之確認分類架構之合適性並進行修正;第四階段則是「精練」(refine),使修正過的目標本體論更精細與目標主體更適配,例如針對修正過的分類架構建構更準確的分類結果。

PTT報告

User Behavior Modeling and Prediction by Mining Multiple Information Sources in Mobile Social Network Space


課程論文研討(一)
日期 : 2013/01/04
時間 : 13:50 ~ 15:30
學生 : 資傳研一 邱文祥
演講者 : 成功大學 曾新穆教授

關聯(Association)、分類(Classification)、叢集(Clustering)、因果(Sequencing)四大類是目前料探勘(Data Mining)是統計領域中充滿挑戰的新學門,並以社交網路社群為出發點,以用戶的訊息去了解其行為方式然後建構出一個預測的行為模式

海量資料:行動運算的最後一塊拼圖

課程: 論文研討(一)
日期 : 2012/12/28
時間 : 13:50 ~ 15:30
學生 : 資傳研一 邱文祥
演講者 : 國網中心 王耀聰

前電子產品「智慧化」已成為趨勢,因此許多資料都須經過處理之後進行預測才能達到智慧化,所以資料分析就是最後一塊拼圖,令裝置智慧化的重要步驟。

海量資料(Big Data)【稱為巨量資料或大數據】指的是所涉及的資料量規模巨大到無法透過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊 [1, 2] 。根據 IBM 的說明 [3] ,海量資料有四個特性,亦稱為海量資料 4V ,亦即資料量龐「大」(Volume)、變化飛「快」(Velocity),種類繁「雜」(Variety),以及真偽存「疑」(Veracity)。換言之,海量資料其實就是資料(Data),只是處於現在資訊網路時代,這些資料特性變的又多、又快、又雜,又真偽難分。
海量資料分析的重要性與運用這些海量資料所帶來的效益息息相關。根據 IBM 的介紹 [3] ,效益至少包括能夠更有智慧的管理、能夠更有智慧的工作、能夠提升生活品質,及能夠迎合消費者喜好。換言之,海量資料的運用創造個人與公司的價值,同時改善人類的生活。

Introduction to Distance Metric Learning


課程論文研討(一)
日期 : 2012/12/21
時間 : 13:50 ~ 15:30
學生 : 資傳研一 邱文祥
演講者 : 海洋大學資訊工程學系 張欽圳


資料分群(data clustering)或是分群演算法(clustering algorithms)是一種將資料分類成群的方法,其主要的目的乃在於找出資料中較相似的幾個群聚(clusters),並找出各個群聚的代表點,稱為中心點(centroids)或是原型(prototypes)。使用這些中心點來代表原先大量的資料點,就可以達到兩個基本目標:
  • 降低計算量
  • 資料壓縮
一般而言,分群法可以大致歸為兩大類:
  • 階層式分群法(hierarchical clustering):群數(number of clusters)可以由大變小,或是由小變大,來進群聚的合併或分裂,最後再選取最佳的群數。
  • 分割式分群法(partitional clustering):先指定群數後,再用一套疊代的數學運算法,找出最佳的分群方式以及相關的群中心。
所有的分群法都有相似的流程,大略可歸納為下列三點:
  1. 收集資料
  2. 使用某種方法進行分群
  3. 測試分群結果
  4. 檢測分群結果,如果未達預期效果,則回到步驟二,再一次進行分群

Bag of Block-Based Visual Words for Image Retrieving and Classification


課程: 論文研討(一)
日期 : 2012/11/16
時間 : 13:50 ~ 15:30
學生 : 資傳研一 劉健興
演講者 : 義守資工系 郭忠民 教授

本次的演講重點在以圖找圖的搜尋技術,著名的搜尋引擎,GOOGLE在這幾年來也有這個嶄新的搜尋方式,而不同於以往以關鍵字找圖的方式,以圖搜圖在搜尋的方法上有一些特別的技術,最基本的是分析圖片紋理來找到相似的圖形,接著再把圖片分成幾個區塊,分成巨觀(顏色分析)和微觀(物件分析)來分析圖片,以圖搜圖不管在現在還是未來都會是一個發展性高的技術,但以目前的現況還是有準確度不足的問題。

資通信與雲端運算發展之探討


課程論文研討()日期 : 2012/12/07時間 : 13:50 ~ 15:40學生 : 資傳研一  邱文祥演講者 : 中華電信總公司客服處處長 簡志誠


在我看來雲端有三種好處

(一)雲端運算架構可整併政府資訊系統,有效減少政府支出,並可減少資訊系統建置時間、降低系統性風險,並可提升便民服務的效率與品質。(二)雲端運算架構及營運模式符合節能減碳及環保趨勢,就使用綠色伺服器而言,全球一年可節省電力損耗約達 112 兆瓦,減少碳排放量超過 7 千萬公噸,臺灣 IT領域節能技術,預期可貢獻超過1/3,提升臺灣國際形象。(一) 容易和便宜,因為硬體,應用和主機的費用由供應商支付。(二) 可擴展性,以滿足需求。(三) 沒有資源浪費,因為你的付出多少錢,你就用多少空間。上述是公有雲私有雲也稱為內部雲或企業雲,是一個專有的計算架構,可提供託管服務,在防火牆後面的人數量有限。先進的虛擬化和分佈式計算允許企業網絡和數據中心管理員能夠有效地成為服務供應商,以滿足企業內部的“客戶”的需求。營銷媒體使用的話“私有雲”的設計像一個組織,他們可以得到一個第三方託管的服務,如Amazon的彈性計算雲(EC2)和簡單存儲上訴服務(S3)。混和雲混合雲是至少有一個私有雲和至少一個公共雲組成的。通常所提供的兩種方法:(一)  混合雲供應商和私有雲和公共雲供應商形成了合作夥伴關係,或與公共雲供應商形成了合作夥伴關係,它提供私有雲的平台。(二)  混合雲除了是一個組織提供和管理內部資源東西外,還有其它的外部提供的雲計算環境。例如,一個組織可能會使用公共雲服務,如Amazon簡單存儲服務(Amazon S3)存檔數據,但繼續保持在內部存儲業務的客戶數據。理想情況下,使企業能夠充分利用公共雲計算環境提供了無任務關鍵型應用程序和數據暴露給第三方漏洞的可擴展性和成本效益。這種類型的混合雲也被稱為混合的IT。

Bag of Block-Based Visual Words for Image Retrieving and Classification

課程: 論文研討(一)
日期 : 2012/11/16
時間 : 13:50 ~ 15:30
學生 : 資傳研一 邱文祥
演講者 : 義守大學資工系 郭忠民 教授

SIFT (Scale-Invariant Feature Transform)就是一種電腦視覺的演算法用來偵測描述影像中的局部性特徵,它在空間尺度中尋找極值點,並提取出其位置、尺度、旋轉不變數。若找兩影像的關鍵點特徵來比對,可發現越相似的影像,關鍵點特徵符合數越多,藉此來判斷兩影像的相似度。


演講者最後所使用方法使用了bag of words,以4×4區塊分割的方式擷取影像的特徵,還加入巨觀與微觀的概念,
建立出巨觀視覺字典與微觀視覺字典,最後在利用影像檢索來驗證視覺字典。
大致上簡單的圖像看起來結果都還不錯,複雜點的就開始有失誤的情況,所以還有待研究。