Learn & Share由H-Y Chou 和 Books and Pencil 共筆,藉由這個平台紀錄著實用工具和好書閱讀,同時也分享著教育學習與思維概念等等多元化的主題。
2023年3月18日 星期六
[Linux] 如何用yum更新kernel系統?
2023年2月13日 星期一
[Python]如何利用Selenium模塊模擬瀏覽器操作網頁?
銜接<[Python]初探爬蟲(scrapy)>的學習,在Python中,除了善用request安裝包抓取網頁資料之外,還可利用selenium安裝包模擬瀏覽器操作網頁,包含搜尋關鍵字和抓取網頁資料,得以實現機機器人流程自動化(RPA, Robotic process automation)的操作。
2023年1月7日 星期六
[Python]如何將批量的PDF資料匯總為Excel清單?
在現今電腦化(或稱無紙化)的辦公環境中,往往因為工作需求需將一些資料在不同辦公文件之間轉移,如若需要呈現簡報(.ppt),可能需將word的部分文字複製到ppt上;若需要分析論文中的表格數據,可能需將pdf轉換成excel。然而,若僅僅是少數文件的轉換,或許可簡單用複製和貼上的功能來處理,但若是批量轉換的工作,為了避免重複性勞力和容易出錯,藉由工具來進行批量轉換才是正確的工作方式。
2022年12月31日 星期六
2022年12月17日 星期六
[Python]如何查看安裝包的狀態,包含安裝路徑?
關於Python,如上篇文章<[Python]初探爬蟲(scrapy)>所述,其藉由各類安裝包的導入可以開展對應程序工作。既然是藉由安裝包的導入,可想而知,一定會有查詢安裝包的指令,網路上很容易搜尋到。(OS: 其實這篇文章的主要目的是為了紀錄今日的幾個重點結論,而查看安裝包的狀態僅是其中一個結論。)
2022年11月19日 星期六
[Python]初探爬蟲(scrapy)
隨著互聯網時代的到來,網路已成為人類生活的資料庫,只要輸入合適的關鍵字,大部分的問題可藉由搜索找到方向。然而,以另一個角度觀察,龐大的網路資料庫也易因為巨量的資料,導致容易失焦,因此如何從資料庫篩選出期望的主題資料是一個重點工作。早有耳聞Python的爬蟲功能,藉著零碎時間看了一些視頻,同時將重點摘要如下,供日後查閱,也供各位參考。
2022年10月23日 星期日
[R]如何繪製條型圖(Bar chart)? geom_bar()
在數據分析中,直方圖(Histogram)和條型圖(Bar chart)是常用於觀察數據樣態的工具。關於直方圖的用法,可參考<[R]直方圖(Histogram)的用法>文章。
關於條型圖的用法,各位一定不陌生,尤其是經過2020年的COVID-19疫情事件,為了統計和比較各區域的確診或死亡病例,各媒體常以條型圖呈現數據。在R語言中,藉由安裝包ggplot2亦可輕鬆繪製,範例程式如下。
2022年9月2日 星期五
[R]如何篩選出特定子集數據? subset()
在R語言中,篩選出特定子集數據的函數為subset(),經由查詢Help的結果,其對應的描述和用法如下。顧名思義,利用邏輯符號表述篩選子集的方式,將符合條件的數據子集合篩選出來。
2022年8月7日 星期日
[R]如何擷取特定字串? substr()
在R語言中,擷取特定字串的函數為substr(),經由查詢Help的結果,其對應的描述和用法如下,顧名思義,substr()的用法僅需要定義原字串x,並定義起始字元和終止字元,即可達成效果。
2022年7月3日 星期日
2022年6月4日 星期六
2022年5月2日 星期一
[R]如何查詢符合條件的對應行列數據?
這個功能類似Excel中Vlookup函數的效果。但Excel畢竟有儲存欄位數量的限制,換句話說,Excel能處理數據量級是受限制的。在R語言中,亦可用which來實現查詢符合條件的對應行列數據。
2022年4月3日 星期日
[R]直方圖(Histogram)的用法
Histograms
Description:
The generic function hist computes a histogram of the given data values.
hist(x, breaks = "Sturges",
main = paste("Histogram of" , xname),
xlim = range(breaks), ylim = NULL,
xlab = xname, ylab,
axes = TRUE, plot = TRUE, labels = FALSE)