back-end-portfolio

後端與程式自學心得整理

View the Project on GitHub

2019熱門電影關鍵字爬蟲


(A)程式學習到的事情:

(B)程式描述:

想要實作出一個文字雲程式,推薦 2019 好看的電影,因此利用爬蟲將 PTT Movie 好雷 文章資訊紀錄於 Dict ,並記錄每一頁的上一頁超連結,在函式內呼叫自己直到日期為 2018 的 12/31 為止,接著作關鍵字拆解,並統計數據輸出至資料庫與文字雲。

2019 電影熱門關鍵字程式 demo

電影熱門關鍵字程式心得紀錄

期中考批改數據

解題想法與概念:

  1. 思考如果要得到 2019 好看的電影名單,該獲取哪些資訊
  2. 利用爬蟲將 日期與好雷電影的標題紀錄於 Dict 中
  3. 利用 Jieba 拆解標題作次數統計
  4. 以不同可視化方式輸出,因此以文字雲呈現,次數越多,字體越大