緣由
初始學習Python便是以資料工程的領域入門,Anaconda提供不少資料科學與分析所需的套件,且預設安裝Jupyter notebook,基於傻瓜部署,一路使用至今。因如下介紹的conda的部署缺點,一直有考慮其他Python開發環境部署方式。
眾所皆知,Apple在2021推出自製ARM M1晶片,本篇操作載入ARM架構下的image,Ubuntu 20.04.5 LTS。
以pyenv + virtualenv紀錄部署上的重點。
初始學習Python便是以資料工程的領域入門,Anaconda提供不少資料科學與分析所需的套件,且預設安裝Jupyter notebook,基於傻瓜部署,一路使用至今。因如下介紹的conda的部署缺點,一直有考慮其他Python開發環境部署方式。
眾所皆知,Apple在2021推出自製ARM M1晶片,本篇操作載入ARM架構下的image,Ubuntu 20.04.5 LTS。
以pyenv + virtualenv紀錄部署上的重點。
從上篇文章中我們可以瞭解
若對上一篇文章有興趣,可參考【爬蟲基礎介紹】part1: 什麼是爬蟲?
爬蟲的本質是模擬人類瀏覽網頁的行為,人類操作瀏覽器瀏覽網頁,也就是最終程式需要模擬瀏覽器與伺服器互動,不被發現偽裝,才能成功完成擷取數據的過程。因此我們需要瞭解瀏覽器與伺服器如何互動
本篇文章會更深入說明,瀏覽器與伺服器在互動時的角色與行為規範
Update your browser to view this website correctly. Update my browser now