对于许多利用JS来载入页面数据的网页来说,利用普通的urllib与requests库往往获取不到信息

所以可以利用PhantomJS来进行JS渲染处理
首先安装Selenium包
然后下载PhantomJS,解压至Python的scripts目录下
使用方法很简单

1
2
3
4
5
6
from selenium import webdriver
driver=webdriver.PhantomJS()
driver.get('https://s.taobao.com/search?q=rio')
data=driver.page_source
print(data)
driver.quit()