差異處
這裏顯示兩個版本的差異處。
Both sides previous revision 前次修改 下次修改 | 前次修改 | ||
公開:csv與excel [2020/12/04 11:51] kent |
公開:csv與excel [2021/01/08 14:40] (目前版本) kent [爬蟲的範例程式含註解] |
||
---|---|---|---|
行 1: | 行 1: | ||
+ | ====== 課堂練習範例 ====== | ||
+ | |||
+ | [[https://www.dropbox.com/s/1mxk13bnweq2owz/BigDataDemo_20201204-1.zip?dl=0|課堂練習範例(至12/04)]] | ||
+ | |||
====== Open Data ====== | ====== Open Data ====== | ||
[[https://zh.wikipedia.org/wiki/開放資料|何謂 Open Data?]] | [[https://zh.wikipedia.org/wiki/開放資料|何謂 Open Data?]] | ||
行 19: | 行 23: | ||
[[https://www.dropbox.com/s/m6x7npom7l7rbb5/BigData_CSV_Samples.zip?dl=0|CSV樣本]] | [[https://www.dropbox.com/s/m6x7npom7l7rbb5/BigData_CSV_Samples.zip?dl=0|CSV樣本]] | ||
+ | |||
+ | ====== Excel套件選擇 ====== | ||
+ | |||
+ | * openpyxl: 支援讀跟寫,以及篩選、公式、插入圖片等,還可以產生圖表。 | ||
+ | * xlsxwriter: 功能與openpyxl相似,但只能產出(寫),不能讀取,但可以支援 VBA 語法。 | ||
+ | * 其他還有別的套件,但限制頗多: [[https://www.itread01.com/p/446412.html|Python-Excel 模組哪家強?]] | ||
+ | |||
+ | ====== openpyxl ====== | ||
+ | |||
+ | [[https://openpyxl.readthedocs.io/en/stable/charts/introduction.html|支援的圖表種類]] | ||
+ | |||
+ | ====== 爬蟲的範例程式含註解 ====== | ||
+ | |||
+ | 此範例程式可以把特殊教育相關新聞的最新200則爬回來,並輸出為 Excel 檔。 | ||
+ | |||
+ | [[https://www.dropbox.com/s/t2ihrec74oz07eq/HelloCrawlGoogleNewsSearch_Demo.ipynb.zip?dl=0|範例程式]] | ||
+ | |||
+ | 使用方式: | ||
+ | - 下載後解開zip取得 ipynb 檔。 | ||
+ | - 把 ipynb 檔上傳至您 docker 的環境中。 | ||
+ | - 開啟並且執行。 | ||
+ | - 執行完畢後,會於同一個目錄中輸出 Output.xlsx 裡面會包含有爬到的新聞內容。 | ||
+ | |||