博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
BeautifulSoup库的安装及测试
阅读量:2429 次
发布时间:2019-05-10

本文共 1324 字,大约阅读时间需要 4 分钟。

  • BeautifulSoup库解释

BeautifulSoup模块是用来从HTML/XML等文件提取所需数据的Python库.,专为快速周转项目而设计,如屏幕抓取。三个功能使其功能强大:

(1)Beautiful Soup提供了一些简单的方法和Pythonic习语,用于导航,搜索和修改解析树:用于剖析文档和提取所需内容的工具包。编写应用程序不需要太多代码

(2)Beautiful Soup会自动将传入的文档转换为Unicode,将传出的文档转换为UTF-8。你不必考虑编码,除非文档未指定编码且Beautiful Soup无法检测到编码。然后你只需要指定原始编码。
(3)Beautiful Soup位于流行的Python解析器之上,如lxml和html5lib,允许尝试不同的解析策略或交易速度以获得灵活性。

  • 1、安装beautifulsoup库

以管理员权限运行pip install beautifulsoup4

在这里插入图片描述

  • 2、测试安装结果
>>> import requests>>> r=requests.get("http://python123.io/ws/demo.html")>>> r.text'This is a python demo page\r\n\r\n

The demo python introduces several python courses.

\r\n

Python is a wonderful general-purpose programming language. You can learn Python from novice to professional by tracking the following courses:\r\nBasic Python and Advanced Python.

\r\n'>>> demo =r.text>>> from bs4 import BeautifulSoup #bs4是beautifulsoup4库的简写,这里是在bs4 库里面导入一个BeautifulSoup类>>> soup=BeautifulSoup(demo,"html.parser") #html.parser解析器用于解析demo的html代码>>> print(soup.prettify()) This is a python demo page

The demo python introduces several python courses.

Python is a wonderful general-purpose programming language. You can learn Python from novice to professional by tracking the following courses: Basic Python and Advanced Python .

>>>

转载地址:http://astmb.baihongyu.com/

你可能感兴趣的文章
真相了 | 敲代码时,程序员戴耳机究竟在听什么?
查看>>
回首互联网十年,我们能从八次烧钱大战中学到什么
查看>>
麒麟信安面向场景化创新,赋能openEuler商业验证
查看>>
3 年培养 10 万“码农”,郑州推出“码农计划”
查看>>
程序员弃码投中医?还做成了不错的生意! | 极客视频
查看>>
百度一 29 岁程序员因“篡改数据”被抓
查看>>
去年我年薪 30W,今年我一天做 3 顿饭
查看>>
入职大厂,我容易吗?
查看>>
狂赚 1227 亿!腾讯员工 2020 年人均年薪 81 万;小米员工人均年薪 45 万
查看>>
漫画:什么是加密算法?
查看>>
程序员有话说 |当那个不靠谱的程序员跟我做同一个项目时
查看>>
程序员是如何运用增长思维找到女朋友?
查看>>
@程序员,离职让企业损失近900亿,还遭疯抢!他凭什么?
查看>>
如何用 Python 一键查房价?
查看>>
累死累活干不过写 PPT 的?新东方年会吐槽视频俞敏洪不罚反奖 12 万!
查看>>
“离开360时,它只给了我一块钱”
查看>>
PDF 翻译神器,再也不担心读不懂英文 Paper 了
查看>>
漫话:如何给女朋友解释什么是RPC
查看>>
情人节她说:是的,嫁人当嫁程序员
查看>>
不要成为自己讨厌的那种程序员 | 程序员有话说
查看>>