基于pycharm的beautifulsoup4库使用方法教程
1.beautifulsoup4库安装
第一步:在控制台输入如下命令,安装beautifulsoup4库。
pip install beautifulsoup4
第二步:在控制台输入如下命令,验证是否成功安装beautifulsoup4
库。
第三步:在pycharm
中,点击file
——settings
——project
——python interpreter
——点击+号——搜索beautifulsoup4
——install package!
这样就可以在.py文件中导入模块了!
2.beautifulsoup4库使用
import requests # 虽然库名叫做beautiful4 但是在导入时 使用的是其缩写bs4 其中BeautifulSoup是一个类名 from bs4 import BeautifulSoup url = 'https://www.baidu.com/s?' # 由于一般网站都是供用户访问 如果检测到User-Agent是黑客或者其他可能拒绝访问 故此处模拟浏览器 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Safari/537.36' } response = requests.get(url=url, headers=headers) # 以防乱码 此处将其编码设置为utf-8 因为有中文 response.encoding = 'utf-8' # print(response.text) # 使用的解析器是html.parser 注意是.奥 soup = BeautifulSoup(response.text, 'html.parser') # 打印解析后的结果 print(soup.prettify())
需要讲解的都在代码注释中了奥!
3.beautifulsoup4库基本元素
beautifulsoup4
库是解析、遍历、维护“标签树”的功能库。
首先来看BeautifulSoup
库解析器,前两个比较常用!
再来看BeautifulSoup
库的基本元素,可以这样理解,标签树和HTML
以及BeautifulSoup
是一样的,我们要看HTML的某些内容就使用BeautifulSoup
的实例化对象查看即可。
在上述代码的基础上,增加如下几行,结合基本元素的使用,可得到如图所示。
需要注意的是,.string
可以跨标签,所以很有可能结果也为注释,为了区分是标签内的字符串还是注释,可以通过打印类型来判断。
总结起来,可如下:
接下来,看一下BeautifulSoup
库的遍历,其中画红框的迭代遍历,可以用于for in循环中。
4.beautifulsoup4库的HTML查找方法
find_all( name , attrs , recursive , string , **kwargs )
find_all()
方法搜索当前tag
的所有tag
子节点,并判断是否符合过滤器的条件。
name
参数可以对名字为 name 的标签进行检索。
attrs参数可以对标签属性值为attrs的标签进行检索。
recursive参数表示是否对子孙全部检索,默认是TRUE,如果只想搜索当前节点的儿子信息,可以置其为FALSE。
string 参数可以标签中的字符串内容进行检索。
5.补充Json(Javascript Object Notation)
我们学过js的或者java的,应该对Json不陌生吧!
Json是一种有类型的键值对!
需要注意的是,键和值都需要用"“括起来,如果值是整数,则可以不用”"!
如果值是多值,则可以用[,];如果值是键值对,则可以用{:,:,},可以嵌套使用。
JSON一般用于接口,而YAML是无类型键值对,一般用于配置文件。
到此这篇关于基于pycharm
的beautifulsoup4
库使用方法教程的文章就介绍到这了,更多相关pycharm
的beautifulsoup4
库使用内容请搜索猪先飞以前的文章或继续浏览下面的相关文章希望大家以后多多支持猪先飞!
原文出处:https://blog.csdn.net/qq_43779149/article/details/122500994
相关文章
- 今天小编就为大家分享一篇解决Pycharm的项目目录突然消失的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...2020-04-22
- pycharm2021激活码是一个可以轻松帮助用户免费激活pycharm2021.1软件的文件,虽然说pycharm现在只是推出了2021.1的EAP版,但是如果你想先率先体验一波,那么就可以利用小编提供的这个激活码来进行使用啦,并这个激活码是永久有效的...2021-03-30
- 这篇文章主要介绍了pycharm实现print输出保存到txt文件,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-02
- 这篇文章主要介绍了pycharm 实现光标快速移动到括号外或行尾的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...2021-02-06
- 这篇文章主要介绍了解决Pycharm 运行后没有输出的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...2021-02-06
pycharm最新免费激活码分享(无须破解,复制粘贴即可 21.4.20亲测可用)
这篇文章主要介分享了pycharm的最新激活码,帮助大家更好的免费使用此IDE,感兴趣的朋友可以了解下...2021-04-20- 这篇文章主要介绍了在PyCharm中安装PaddlePaddle的方法,本文给大家介绍的非常想详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2021-02-05
- 这篇文章主要介绍了Pycharm 设置默认解释器路径和编码格式的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...2021-02-05
详解pycharm的python包opencv(cv2)无代码提示问题的解决
这篇文章主要介绍了详解pycharm的python包opencv(cv2)无代码提示问题的解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧...2021-01-29- 这篇文章主要介绍了Pycharm 跳转回之前所在页面的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...2021-02-05
- 这篇文章主要介绍了Pycharm 如何一键加引号的方法步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧...2021-02-05
- 这篇文章主要介绍了pycharm激活方法到2099年,文末给大家提到了idea和pycharm最新版激活方法,非常不错对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2020-09-15
- 这篇文章主要介绍了基于Pycharm加载多个项目过程图解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下...2020-04-22
解决pycharm下载库时出现Failed to install package的问题
很多小伙伴遇到pycharm下载库时出现Failed to install package不知道怎么解决,下面小编给大家带来了解决方法,需要的朋友参考下吧...2021-09-04- 这篇文章主要介绍了PyCharm设置注释字体颜色以及是否倾斜的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...2020-09-16
- 这篇文章主要介绍了pycharm 复制代码出现空格的解决方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...2021-01-16
基于Python-Pycharm实现的猴子摘桃小游戏(源代码)
这篇文章主要介绍了基于Python-Pycharm实现的猴子摘桃小游戏,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下...2021-02-20- 这篇文章主要介绍了pycharm 多行批量缩进和反向缩进快捷键介绍,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...2021-01-16
将pycharm配置为matlab或者spyder的用法说明
这篇文章主要介绍了将pycharm配置为matlab或者spyder的用法说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧...2020-06-09- 这篇文章主要介绍了pycharm 如何取消连按两下shift出现的全局搜索?下面小编就为大家介绍一下解决方法,还等什么?一起跟随小编过来看看吧...2021-01-16