【爬蟲基礎介紹】part2: HTTP架構

6月 23 2022 爬蟲 10 分鐘讀完 (約 1526 字)

從上篇文章中我們可以瞭解

爬蟲的本質是模擬人類瀏覽網頁的行為，人類操作瀏覽器瀏覽網頁，也就是最終程式需要模擬瀏覽器與伺服器互動，不被發現偽裝，才能成功完成擷取數據的過程。因此我們需要瞭解瀏覽器與伺服器如何互動

本篇文章會更深入說明，瀏覽器與伺服器在互動時的角色與行為規範

【爬蟲基礎介紹】part1: 什麼是爬蟲?

6月 12 2022 爬蟲 11 分鐘讀完 (約 1597 字)

爬蟲是一個程式

這個程式可以做什麼？

可以模擬人類瀏覽網頁的行為，從中獲取網頁上所需的數據

比較口語化的說法是可以代替你自動從網站中取得資料，幾個優點如下，包括