Python爬虫入门requests库的安装与使用

Python爬虫入门requests库的安装与使用Requests库的详细安装过程对于初学Python爬虫小白,认识和使用requests库是第一步,requests库包含了网页爬取的常用方法。下面开始安装requests库。1.检查是否安装过requests库:Windows加r打开cmd命令提示符,输入pipinstallreques

大家好,欢迎来到IT知识分享网。

Requests库的详细安装过程

对于初学Python爬虫小白,认识和使用requests库是第一步,requests库包含了网页爬取

的常用方法。下面开始安装requests库。

1.检查是否安装过requests库:Windows加r打开cmd命令提示符,输入pip install requests,

回车查看。

2.若回车后显示空,则需要下载安装tar包。网站链接:https://pypi.org/project/pip/#files。

Python爬虫入门requests库的安装与使用

 

 

 3.解压下载的tar包,将pip文件放在Python安装目录下的lib包内。

4.打开cmd命令管理器,输入pip install requests,显示如下图则安装成功。

Python爬虫入门requests库的安装与使用

 

 Python对于其他库函数的安装类似如上方法。例如BeautifulSoup4的安装,只需按上面步骤

即可,命令行输入pip install beautifulsoup4。

requests库的常用方法

Python爬虫入门requests库的安装与使用

 

 get()方法

get()方法构造一个请求服务器的request对象。

requests.get()

r = requests.get(url)

r是返回的一个包含服务器资源的对象

response对象的属性

Python爬虫入门requests库的安装与使用

 

r.status_code返回的要么是200,要么是404或者其他,只有返回200时是表示连接成功。

r.text返回输出网页的内容,解决乱码问题。

r.encoding返回网页的编码,如果header不存在charset,则默认返回ISO-8859-1。

r.apparent_encoding,从文本内容分析出网页的编码方式。实际上更加全面。

Requests库的异常

Python爬虫入门requests库的安装与使用

 

 Response的异常

返回状态不是200时,产生一个requests.HTTPError的异常。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/35088.html

(0)
上一篇 2024-04-10 20:15
下一篇 2024-04-11 12:26

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

关注微信