data:image/s3,"s3://crabby-images/73081/730814eb7afd3530f30d19eb99c6dcc9fda4434f" alt="Python网络爬虫技术与实战"
上QQ阅读APP看书,第一时间看更新
练习题
1.urllib库包含哪些主要模块?
2.给出URL解析的执行结果。
from urllib import parse
url=“http://www.baidu.com/s?username=Python”
result=parse.urlparse(url)
print("urlparse出来的结果:%s" % str(result))?'
3.利用request抓取新浪网站图标。
4.写出下列代码的执行结果。
from lxml import etree
html=etree.parse('test.html')
print (type(html))
result=html.xpath('//li/@class')
print (result)