Python - 網路爬蟲 (Web Crawler)
..................................................# Date : 2021-05-10
..................................................
# Keywords: Code, Python, Web crawler, ... .
..................................................
# 網頁爬蟲與資料分析流程 [CASTMAN]:
- [1] 尋找資料來源
- [2] 使用 python 套件進行爬蟲
- [3] 截取並過濾資料
- [4] 分析資料
- [5] 展示資料
# 使用工具:Python、Jupyter。
# 使用套件:
# Installation :
[] 安裝 requests:於 CMD 輸入 pip3 install requests
[] 安裝 BeautifulSoup: 於CMD 輸入 pip install beautifulsoup4
..................................................
# 根據不同網頁內容使用不同套件來解析:
..................................................
# 網路爬蟲範例:
[] 用 beautifulsoup 解析 HTML,抓標題:https://youtu.be/9Z9xKWfNo7k
..................................................
實際步驟:
一、載入套件
二、截取網頁資訊:使用 get
抓取圖片:
- [] Python 網路爬蟲(基礎篇)knowlab, 20160628, https://knowlab.wordpress.com/2016/06/28/python-網路爬蟲(基礎篇)/
- [] [爬蟲實戰] 如何爬取圖片以建立慾望之牆?, Youtube, https://youtu.be/9unqUH0PYCI
- [] BeautifulSoup, WIKI, https://zh.wikipedia.org/zh-tw/Beautiful_Soup
- [] Pandas, https://pandas.pydata.org/