2018年3月15日 星期四

[R]R與Tableau的數據共舞_以臺北市政府資料開放平台(Data.Taipei)為例


關於數據處理工具R語言,R-bloggers是一個不錯的資源網站。除了R語言本身的資訊更新和相關應用之外,該網站對於其他數據處理分析工具的建議用法和評價內容,也具有相當高的參考價值。

Exploratory Analysis – When to Choose R, Python, Tableau or a Combination一文針對R、Python和Tableau等三種數據處理工具,評價其各自的優缺點,並提供建議挑選和整合的使用方式。文章內容提及Tableau擅長以各式圖表凸顯數據內容,使達到資訊視覺化,然而Tableau處理網頁爬蟲等等類似工作卻是令人頭疼。因此將數據表格丟入Tableau之前,將可善用R進行前置工作,包含網頁資料抓取和資料整理工作,使R和Tableau均拿出各自強項,共同完成資料處理工作。(OS: 企業的人力資源配置和團隊工作,何嘗不也是如此? 善用大家的長處,有效率地完成任務。)

藉由台北市政府資料平台的資料集,利用R抓取台北市空氣監測站數據,並藉由tidyverse和stringr套件進行資料整理工作,包含字串拆解、刪除不必要和多餘的資料欄位等等工作。最後,使資料以.csv格式匯出,供Tableau讀取。資訊視覺化的結果如本文封面圖和圖一所示,由圖表呈現,可清楚解讀台北市各站在不同時間點所監測的空氣指標,空氣指標包含PM2.5和O3。另外,Tableau也提供網頁嵌入碼,使數據依選擇條件即時動態呈現,自行勾選右側條件玩玩看吧。

最後,分享同樣在R-blogger的Tableau相關應用文章,其利用Tableau結合地圖來呈現印度區域的各類礦產資訊,是個不錯的學習範本。

圖一、中正站於2018/02/28~03/10期間的PM2.5指標狀態




Reference:
Indian mineral data visualization on Tableau

延伸閱讀:[R]如何處理壓縮檔案(.zip)並彙整成圖表_以北市府X亞馬遜AWSX大學雲端大數據跨界合作資料集專區為例?

3 則留言:

  1. [url= http://www.sthint.com/2017/11/17/100-instant-approval-free-dofollow-blog-commenting-sites-list-2018/] We have update list of do-follow blog commenting sites [/url]

    回覆刪除
  2. Dear pham thai hoa:
    It seems an useful tool for data visualization. Thanks for your information.

    回覆刪除