前言

这篇文章会列举几个学python爬虫的简单例子。

一、搜狗爬取周杰伦

进入搜狗首页，在搜索引擎中输入周杰伦，进入周杰伦首页。
我们得到了网址”https://www.sogou.com/web?query=周杰伦”，即拿到了url=“https://www.sogou.com/web?query=周杰伦”。
右键 ->检查，进入下图界面

刷新一下，点击网络（network），选择标头，可以看到请求URL、请求方式、状态码等等信息，往下拉看到User-Agent，做为headers，避免反爬。

import requests
url="https://www.sogou.com/web?query=周杰伦"
headers={ 
   
	"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36 Edg/97.0.1072.55"
	}   #以字典的形式设置请求头，处理反爬
resp=requests.get(url,headers=headers)
print(resp)  #结果：<Response [200]>
print(resp.text) #拿到页面源代码
resp.close()  #关掉resp

IT知识分享网

上述案例可以进一步改进，实现查询自由，代码如下：

IT知识分享网import requests
query=input("请输入一个你喜欢的明星：")
url=f"https://www.sogou.com/web?query={query}"
headers={ 
   
	"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36 Edg/97.0.1072.55"
	}
resp=requests.get(url,headers=headers)
print(resp)
print(resp.text)  #拿到页面源代码
resp.close()  #关闭resp

二、百度翻译

代码如下

import requests
url="https://fanyi.baidu.com/sug"
s=input("请输入要翻译的英文单词")
dat={ 
   
	"kw":s
	}
resp=requests.post(url,data=dat)#发送post请求，发送的数据必须放在字典中，通过data参数进行传递
print(resp.json()) #将服务器返回的内容直接处理成json => dict
resp.close()

三、豆瓣电影

代码如下：

IT知识分享网import requests
url="http://movie.douban.com/j/chart/top_list"
param={ 
   
	"type":"24",
	"interval_id":"100:90",
	"action":"",
	"start":0,
	"limit":20,
	} #右键->检查，network，点击Payload即可将参数复制到此处的字典
headers={ 
   
	"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36 Edg/97.0.1072.55"
	}
resp=requests.get(url=url,params=param,headers=headers)
print(resp.json())
resp.close() #关掉resp

总结

这里对文章进行总结：以上就是今天要讲的内容，本文介绍了简单的爬虫案例，希望对大家有所帮助哟！

免责声明：本站所有文章内容,图片，视频等均是来源于用户投稿和互联网及文摘转载整编而成，不代表本站观点，不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益，请在线联系站长,一经查实,本站将立刻删除。本文来自网络,若有侵权，请联系删除，如若转载，请注明出处：https://yundeesoft.com/4194.html

Python爬虫实例（含代码）超详细教程

文章目录

前言

一、搜狗爬取周杰伦

二、百度翻译

三、豆瓣电影

总结

相关推荐

发表回复