案例:pchome24h 爬蟲 - 搜索功能 多頁搜索

撰寫時的直播影片

https://youtu.be/emMJss6rJGE?t=4076

本文請先參考 第一篇

案例:pchome24h 商品爬蟲 - 搜索功能

首先 根據上一篇的分析

原始網址:
https://ecshweb.pchome.com.tw/search/v3.3/all/results?q=%E8%97%8D%E8%8A%BD%E9%9F%B3%E9%9F%BF&page=1&sort=sale/dc
分析結果 
 使用的傳輸方法:GET
 請求的內容有 q , page , sort
 從英文直譯的猜測
 q = 查詢的關鍵字
 page = 第幾頁
 sort = 排序

開發邏輯

要做多頁搜索,最簡單的便是直接修改 page的參數為第幾頁
那麼問題就來了,頁面到底有幾頁?
所以我們的開發順序如下
1. 搜索結果到底有幾頁
2. 針對每個頁數來進行抓取

觀察 頁數顯示在哪裡

針對JSON的資料處理

JSON相關的處理 請參考 這裡

以下為範例程式碼

輸出結果

Last updated

Was this helpful?