- Python网络爬虫技术与实战
- 赵国生 王健编著
- 80字
- 2025-02-28 14:26:32
练习题
1.urllib库包含哪些主要模块?
2.给出URL解析的执行结果。
from urllib import parse
url=“http://www.baidu.com/s?username=Python”
result=parse.urlparse(url)
print("urlparse出来的结果:%s" % str(result))?'
3.利用request抓取新浪网站图标。
4.写出下列代码的执行结果。
from lxml import etree
html=etree.parse('test.html')
print (type(html))
result=html.xpath('//li/@class')
print (result)