差異處

這裏顯示兩個版本的差異處。

連向這個比對檢視

Both sides previous revision 前次修改
下次修改
前次修改
公開:csv與excel [2020/12/04 04:58]
kent
公開:csv與excel [2021/01/08 14:40] (目前版本)
kent [爬蟲的範例程式含註解]
行 1: 行 1:
 +====== 課堂練習範例 ======
 +
 +[[https://​www.dropbox.com/​s/​1mxk13bnweq2owz/​BigDataDemo_20201204-1.zip?​dl=0|課堂練習範例(至12/​04)]]
 +
 ====== Open Data ====== ====== Open Data ======
 [[https://​zh.wikipedia.org/​wiki/​開放資料|何謂 Open Data?]] [[https://​zh.wikipedia.org/​wiki/​開放資料|何謂 Open Data?]]
行 17: 行 21:
 ====== CSV ====== ====== CSV ======
 [[https://​zh.wikipedia.org/​wiki/​逗号分隔值|何謂 CSV?]] [[https://​zh.wikipedia.org/​wiki/​逗号分隔值|何謂 CSV?]]
 +
 +[[https://​www.dropbox.com/​s/​m6x7npom7l7rbb5/​BigData_CSV_Samples.zip?​dl=0|CSV樣本]]
 +
 +====== Excel套件選擇 ======
 +
 +  * openpyxl: 支援讀跟寫,以及篩選、公式、插入圖片等,還可以產生圖表。
 +  * xlsxwriter: 功能與openpyxl相似,但只能產出(寫),不能讀取,但可以支援 VBA 語法。
 +  * 其他還有別的套件,但限制頗多:​ [[https://​www.itread01.com/​p/​446412.html|Python-Excel 模組哪家強?]]
 +
 +====== openpyxl ======
 +
 +[[https://​openpyxl.readthedocs.io/​en/​stable/​charts/​introduction.html|支援的圖表種類]]
 +
 +====== 爬蟲的範例程式含註解 ======
 +
 +此範例程式可以把特殊教育相關新聞的最新200則爬回來,並輸出為 Excel 檔。
 +
 +[[https://​www.dropbox.com/​s/​t2ihrec74oz07eq/​HelloCrawlGoogleNewsSearch_Demo.ipynb.zip?​dl=0|範例程式]]
 +
 +使用方式:​
 +  - 下載後解開zip取得 ipynb 檔。
 +  - 把 ipynb 檔上傳至您 docker 的環境中。
 +  - 開啟並且執行。
 +  - 執行完畢後,會於同一個目錄中輸出 Output.xlsx 裡面會包含有爬到的新聞內容。
 +
 +