介绍BeautifulSoup库的使用,并爬取股票代码

介绍BeautifulSoup库的使用,并爬取股票代码代码如下:#本代码介绍BeautifulSoup库的使用,并爬取股票代码#1、导入相应的模块import requestsfrom bs4 im

大家好,欢迎来到IT知识分享网。

代码如下:

#本代码介绍BeautifulSoup库的使用,并爬取股票代码
#1、导入相应的模块
import requests
from bs4 import BeautifulSoup
#2、对网页进行get请求
url="http://quote.eastmoney.com/center/gridlist.html#hs_a_board" #设置东方财富网个股行情中心为爬取网站的地址
headers={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:69.0) Gecko/20100101 Firefox/69.0"} #设置请求头
response=requests.get(url,headers=headers) # 对网页url进行get请求
response.encoding="utf-8" #设置编码格式为utf-8
html=response.text
#3、解析网站并打印相应内容
soup=BeautifulSoup(html,"html.parser") #设置html.parser为解析器
print("格式化后的html代码:",soup.prettify())
print("标题信息:",soup.title.string)
print("网页的head标签:",soup.head)
print("网页的meta标签:",soup.meta)
print("网页的第一个a标签属性href的值:",soup.a.attrs["href"])
print("网页的第一个a标签内部的内容:",soup.a.string)
print("打印a标签的父节点:",soup.a.parent)
print("打印a标签的祖先节点:",soup.a.parents)
print("网页的第一个a标签属性下一个的值:",list(enumerate(soup.a.previous_siblings)))

运行结果如下图所示:

介绍BeautifulSoup库的使用,并爬取股票代码

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/39201.html

(0)

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

关注微信