日誌

python自學之路(1) - 爬蟲 - requests 模組

已有 410 次閱讀2017-11-3 22:01 |個人分類:python自學| python, requests

最近在努力學python，目的是為了學爬蟲，爬蟲主要是要抓取別人網頁資料，抓取的方向目前知道有二種，urllib and requests 模組，

不過哪個好用目前仍不清楚，今天試了一下requests成功完成第一步，把網頁的整個html抓下來，以下簡單示範code：

分步驟說明

1. 要先安裝模組request , beautifulsoup4

開啟終端機terminal ：win + R >> cmd >> 直接輸入 pip install requests >>完成

備註：電腦要先安裝python 3 以上的版本哦，然後開啟cmd之後，不要急著就輸入python進入環境，要先pip intall，不要像我傻傻的XD

2.匯入 Iimport 套件

import requests

from bs4 import BeautifulSoup

3.擷取網頁資料

wnat = requests.get(“http://example.com”)

print(want.text)

今天先到這裡，之後才有東西寫XD~~

免責聲明：本網站是以即時上載留言的方式運作，本站對所有留言的真實性、完整性及立場等，不負任何法律責任。

而一切留言之言論只代表留言者個人意見，並非本網站之立場，用戶不應信賴內容，並應自行判斷內容之真實性。