最近在努力學python,目的是為了學爬蟲,爬蟲主要是要抓取別人網頁資料,抓取的方向目前知道有二種,urllib and requests 模組,
不過哪個好用目前仍不清楚,今天試了一下requests成功完成第一步,把網頁的整個html抓下來,以下簡單示範code:
分步驟說明
1. 要先安裝模組request , beautifulsoup4
開啟終端機terminal :win + R >> cmd >> 直接輸入 pip install requests >>完成
備註:電腦要先安裝python 3 以上的版本哦 , 然後開啟cmd之後,不要急著就輸入python進入環境,要先pip intall,不要像我傻傻的XD
2.匯入 Iimport 套件
import requests
from bs4 import BeautifulSoup
3.擷取網頁資料
wnat = requests.get(“http://example.com”)
print(want.text)
今天先到這裡,之後才有東西寫XD~~