练习题_Python网络爬虫技术与实战-QQ阅读中文都市网

Python网络爬虫技术与实战

上QQ阅读APP看书，第一时间看更新

上一章目录下一章

练习题

1.urllib库包含哪些主要模块？

2.给出URL解析的执行结果。

from urllib import parse

url=“http://www.baidu.com/s?username=Python”

result=parse.urlparse(url)

print("urlparse出来的结果:%s" % str(result))?'

3.利用request抓取新浪网站图标。

4.写出下列代码的执行结果。

from lxml import etree

html=etree.parse('test.html')

print (type(html))

result=html.xpath('//li/@class')

print (result)

上一章目录下一章