2013年1月4日 星期五

User Behavior Modeling and Prediction by Mining Multiple Information Sources in Mobile Social Network Space

課程:論文研討(三)
日期:2013/01/04
時間:13:50 ~ 15:30
學生:資傳研二 陳冠宏
演講者:成功大學 曾新穆教授

心得感想:

        Data Mining 是 Data Warehouse 應用方式中最重要的一種。基本上,Data Mining 是用來將你的資料中隱藏的資訊挖掘出來,所以 Data Mining 其實是所謂的 Knowledge Discovery 的一部份,Data Mining 使用了許多統計分析與 Modeling 的方法,到資料中尋找有用的特徵(Patterns)以及關連性(Relationships)。 Knowledge Discovery 的過程對 Data Mining 的應用成功與否有重要的影響,只有它才能確保 Data Mining 能獲得有意義的結果。在任何企業中資料探勘都是非常重要的,如果善加利用挖掘出來的資訊,將對企業有很大的幫助,但相對的資料探勘的困難度高,應用在實際的例子上更是需要學問,運用得好就可以讓機器或設備有智慧,故資料探勘一直是學界業界看重的一環。


海量資料:行動運算的最後一塊拼圖


課程: 論文研討(三)
日期 : 2012/12/28
時間 : 13:50 ~ 15:30
學生 : 資傳研二 陳怡安
演講者 : 國網中心 王耀聰

說書人講故事

由於行動裝置與電腦運算能力日新月異,因此隨時隨地即可透過網路取得服務的雲端運算概念就強大起來了
因此建立了巨大的雲端運算產業,由個人行動裝置APP到大架構的硬體管理系統,包山包海包尿布

同時,透過大量數據推斷雲端產業的未來前景 - 大美滿

Introduction to Distance Metric Learning


課程: 論文研討(三)
日期 : 2012/12/21
時間 : 13:50 ~ 15:30
學生 : 資傳研二 陳怡安
演講者 : 海洋大學資訊工程學系 張欽圳


距離測度學習(Distance Metric Learning)

講白了,其實就是比對資料之間的量化相似度(差異性)
兩筆資料(比對物)間距離值愈小,則表示兩筆資料在某方面的相似性程度愈高

不同性質的資料,則有不同的距離量測方式。


常用類型:

歐氏距離(Euclid Distance)
求m維空間中兩個點之間的真實距離。

曼哈頓距離(Taxicab geometry)
兩個點上在標準座標繫上的絕對軸距總和。

馬氏距離(Mahalanobis distance)
表示數據點之間的共變異數距離。


常見測距演算:
KNN(K-nearest neighbor)
一種機械學習方法,而做法為比對測試資料與一群訓練資料中距離最接近K個的資料


SVM(Support Vector Machine)
在n維度空間出相異集合的超平面(hyperplane),使之將兩個不同的集合分開。


RBF(Radial Basis Function Network)
一種類神經網路,不好解釋

資通信與雲端運算發展之探討


課程: 論文研討(三)
日期 : 2012/12/7
時間 : 13:50 ~ 15:30
學生 : 資傳研二 陳怡安
演講者 : 中華電信總公司客服處處長 簡志誠


心得:


雲端技術簡介 10%
雲端運算技術產業的產業結構 15%
各國的雲端運算技術產業相關政策解說 5%
目前中華電信提供的相關雲端服務 70%

聽中華電信老王賣瓜,不如重溫刺陵

海量資料:行動運算的最後一塊拼圖

課程: 論文研討(一)
日期 : 2012/12/28
時間 : 13:50 ~ 15:30
學生 : 資傳研一 王健任
演講者 : 國網中心 王耀聰

目前來說各種家電的網路化及數位化的數度越來越快,相信很快的家中所有的物體都可以經由網路來控制,由於未來所有東西幾乎都可以連上網路,目前的IP已經不夠使用,所以啟用了IPV6,面對如此龐大數量的裝置,必然會產生龐大的資料,所以未來這方面的人才將會非常的搶手未來處理海量工作的人必須了解SMAQ ,其中代表性的軟體為Hadoop,因使用者規模夠大,可以建構出豐富的海量資料工具庫
只要想得出方法有效的使用與管理海量資料,這將會帶來很大的商機

海量資料:行動運算的最後一塊拼圖


課程: 論文研討(一)
日期 : 2012/12/28
時間 : 13:50 ~ 15:30
學生 : 資傳研一  李金龍
演講者 : 國網中心 王耀聰

心得感想:
演講主要再敘述未來的雲端行動運算中,還有一塊區域是未完善的,從物聯網的崛起、雲端運算、雲端海量的資料、智慧城市應用等等,以資料本身的視角去說明,由物聯網->雲端資料服務中心->開放資料Open Data->Big Data->各類終端設備在這整個過程中有一塊區域就是Big Data,它的問題會由於越來越多的使用者而產生,根據趨勢使用的空間容量已經成幾何的成長,這個問題也越凸顯出來。















圖片來源: 演講者公開的投影片

2013年1月1日 星期二

海量資料:行動運算的最後一塊拼圖


課程: 論文研討()
日期 : 2012/12/28
時間 : 13:50 ~ 15:30
學生 : 資傳研二 溫千力
演講者國網中心 王耀聰

心得報告

目前電子產品「智慧化」已成為趨勢,因此許多資料都須經過處理之後進行預測才能達到智慧化,所以資料分析就是最後一塊拼圖,令裝置智慧化的重要步驟。整個演講是圍繞著下圖進行介紹,內容包括雲端的起源、趨勢、定義與應用等方面。演講者無介紹太多雲端技術,而是著重在雲端服務上,雲端運算是必須隨時隨地使用任何裝置可存取各種服務,因此以商機而言是在「雲」資料中心提供服務方面。演講者以說故事的方式介紹雲端,雖然可以讓人容易了解他所要傳達的資訊,但資料過多令人無法吸收。

2012年12月30日 星期日

海量資料:行動運算的最後一塊拼圖 From WSN to Mobile Computing, Big Data: The Missing Pussle


課程論文研討()
日期:2012/12/28
時間:13:50 ~ 15:30
學生:資傳研二 葉怡婷
演講者:國網中心 王耀聰

心得感想:
雲端運算並不是一項全新的技術,而是一個概念,因著人類所屬的環境資料大量數位化,而造成今日的海量資料,過去電腦的計算和儲存方式,已經無法負荷這樣的情況,因此各國開始推展雲端的概念,並實行於現實中。而雖然現在發展得尚未成熟,但已經可以看到許多改變和趨勢,例如:物聯網的時代來臨、智慧電網的新政策、搜尋關鍵字的熱門度、開放資料的新趨勢。
雲端的重點也不在於技術,而是在商業模式的改變。過去的商業模是習慣軟硬體的買斷以及定點服務,但雲端時代開始則以租賃及行動服務為導向。所以可以知道,雲端是可以隨時隨地使用任何具網路功能的裝置存取各種服務,所以資源是共享的,也可快速的重新部屬,但同時也是一種可被監控和測量的服務。所以,以雲端來說,服務就是他的本質。而這些雲端的提供者,除了有工用雲端、司有雲端、還有社群雲端,服務的對象分別針對中小企業、大型企業以及學術。
所以從上述可知,雲端關鍵的驅動力有三個:1. 因應全球資料爆炸,資料網雲端擺放可試圖解決這個問題。2. 隨時提供個人所需的行動服務。3. 降低企業的經營成本,以租另取代買斷,動態隨需付費。這三個關鍵的驅動力,使得雲端運算成為必然的趨勢。
然而我個人比較好奇的是如何管理海量資料?講者今天的演講回答了我的這個問題:海量的資料挑戰在於如何管理「數量」、「增加率」與「多樣性」。目前資料的數量已經是從TB開始起跳,到PBEB,可見資料量的龐大。而資料的增加率則可分為批次作業和即時作業。至於資料的多樣性就得靠結構化、半結構化、非結構化資料來區分。以這三種角度來管理海量的資料,使得存放海量資料便不再是夢想。
自從雲端的概念被推出之後,就被非常熱絡的使用,近來系上也請了不少講者、教授來建立我們對雲端的概念,但可以發現都是瑣碎、零散的,然而這次的講者帶來了非常完整的雲端概念,從硬體介紹,到重點的海量資料運算,到現實的應用情況,將我們過去學到的概念全部融會貫通。但也由於這次帶來的資料非常得豐富,一次聽完還真的是有點吃力,可以的話,我會希望這次的演講能夠分成兩次,然後再作更深入的介紹,或許會有更好的成效。