【Python網路爬蟲筆記1】抓取整個網頁

阿寶哥
·
(修改过)
·
IPFS
·
在開始之前,你可能需要先安裝requests這個模組。
pip install requests

以下是爬取ssr1這個網站首頁的程式碼:

import requests

url = 'https://ssr1.scrape.center/'
response = requests.get(url)
print(type(response))  # Response物件
if response.status_code == 200:
    print(response.text)  # HTML

首先,我們需要引入requests模組,url是目標網站的網址。requests.get(url)用get方法取得url網站的內容後,丟給response物件。response物件有2個主要的屬性:status_code為200時,表示正常收到網頁伺服器的回應;text屬性則是回應的HTML網頁原始碼。以下是部分的輸出結果:

從第1行可以看出,response的資料型態是Response物件。

只要短短的幾行程式碼就抓到了整張網頁的原始碼,是不是很簡單呢?




CC BY-NC-ND 2.0 授权

喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!