- 課程:106-2 資料科學程式設計
- 學生:謝誌紘
- 學籍:植物科學研究所碩一
- 學號:r06b42001
- 作業 project5
- 作業 project4
- 目標: 利用ML預測與學習資料
- 作業<project 3> 變數處理與畫圖
- 作業<project 3> ML預測
- 這是我們三個人一起寫作完成,我們視覺化分析titanic train data 選擇˙pclass + sex + family + body + boat 五個變數
- 再利用SVM進行學習: 準確率有0.978!!!!!
-小組報告<project 2> PTT連結
- 目標: 本周目標為學習TF-IDF進行文本探勘,挖掘重要關鍵字
- 課堂中:
- 上周作業更新上傳
- TF-IDF資料閱讀
- 課後:
- 發現到TermDocumentMatrix 功能會出現亂碼,好像是R版本問題,仍無法解決
- hw_5
- 從中華民國總統府網站下載元旦文告文本(88-105)
- 利用R進行文本分析、文本清理與斷詞
- 利用TF-IDF演算法進行文字探勘與ggplot做資料視覺化
- 參考資料: 老師Live code & TF-IDF資料視覺化
- <上傳hw5> Hw5(project1)
- 第一周的課程為R語言的入門。為了具備R的語言基礎,我利用R翻轉教室簡單認識R語言的資料結構、流程控制及Course 1 對於R code有基本的認識。
- <hw_1> 2017.3.7 已經更新上傳
- 目標: 本周的目標為利用R語言進行網頁爬蟲。藉由爬蟲,可以從網頁上獲取有用的資料,並進行後續資料處理與分析。
- 課堂中 :
- Course2 內容學習
- R資料結構: dataframe
- 網頁爬蟲 : 閱讀爬蟲參考指令與老師範本,利用chrome觀察中央氣象局地震資料
- 課後 :
- Github markdown 延伸學習1 https://guides.github.com/features/mastering-markdown/
- Github markdown 延伸學習2 https://github.com/othree/markdown-syntax-zhtw
- R markdown 延伸學習 : Youtube 影片
- hw_2
- 使用中央氣象局地震資料進行網頁爬蟲- 利用rvest套件
- 利用SelectorGadget以CSS進行網頁觀察
- 資料清理,整理成dataframe形式
- data image : 因為資料有地震經緯度點,因此利用ggmap套件進行視覺化https://blog.gtwang.org/r/r-ggmap-package-spatial-data-visualization/
- 建立R markdown、html
- <上傳hw2> https://github.com/dppss90008/NTU_code/tree/master/week_2/hw_2 https://dppss90008.github.io/NTU_code/week_2/hw_2/EarthquakeRCrawler.html
-目標 : 本周的目標為利用R語言進行資料視覺化。藉由視覺化,可方便使用者觀測收集到的資料
- 課堂中 :
- 資料視覺化內容學習(練習使用內建之iris data) https://yijutseng.github.io/DataScienceRBook/vis.html#section-8.1
- 共學活動<議題>網頁爬蟲-深入探索 CSS selector <夥伴鄭亦辰> https://docs.google.com/spreadsheets/d/1VGTjP-O-gBMgUo_zZ5ld_LBLIsaT6Kim4lHBFJGYcLM/edit#gid=1453477086
- 課後 :
- 問題: 使用R markdown時遇到圖片出不來的情況
- R markdown 使用教學<問題解決> https://joe188032.github.io/pecuclass1/rmarkdownteach.html#1
- hw_3
- 將上週中央氣象局地震資料存取成CSV file
- 利用gggmap套件視覺化觀測地震資料發生地點
- 利用ggplot套件分析地震規模、深度發生次數
- 利用qplot套件分析規模、深度相關性
- 建立R markdown、html
- <上傳hw3> https://github.com/dppss90008/NTU_code/tree/master/week_3/hw3 https://dppss90008.github.io/NTU_code/week_3/hw3/W3_data_Imaging_N.html
-目標 : 利用FacebookAPI分析Facebook文本資料,並繪製文字雲
- 課堂中 :
- FacebookAPI資料學習
- 共學活動<議題>Facebook API
- 課後 :
- 書籍閱讀-應用R語言於資料分析 : 從機器學習、資料探勘到巨量資料 / 李仁鐘著
- R文字雲 http://to52016.pixnet.net/blog/post/342915697-%5Br%5D-%E8%B3%87%E6%96%99%E7%A7%91%E5%AD%B8--text-mining-%E6%96%87%E5%AD%97%E9%9B%B2---%E4%BB%A5%E8%87%AA%E7%94%B1%E6%99%82%E5%A0%B1%E9%AB%94
- R斷詞 https://blog.stranity.com.tw/2016/11/22/%E6%96%87%E5%AD%97%E6%8E%A2%E5%8B%98%EF%BC%8D%E4%B8%AD%E6%96%87%E6%96%B7%E8%A9%9E/
- hw_4
- 利用FacebookAPI 收集靠北中興發文資料
- 資料清理,整理成dataframe形式
- 繪製文字雲
- 建立R markdown、html
- <上傳hw4>
https://dppss90008.github.io/NTU_code/week_4/hw_4/RfacebookAPI.html