«

python解析库BeautifulSoup怎么安装

时间:2024-6-8 09:49     作者:韩俊     分类: Python


本篇内容主要讲解“python解析库BeautifulSoup怎么安装”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“python解析库BeautifulSoup怎么安装”吧!

    一、Beautiful Soup的安装

    Beautiful Soup是Python的一个HTML或XML的解析库,使用它可以很方便地从网页中提取数据。它的解析器是依赖于lxml库的,所以在此之前,请确保已经成功安装好了lxml库。

    本文环境是windows 10 64位+ python3.11, 此处以windows安装为例。

    1.1 安装lxml库

    lxml库的安装,首先尝试使用pip进行安装:

    pip install lxml

    如果pip安装报错,比如提示缺少libxml2库等信息,那么可以采用wheel方式安装

    采用wheel方式安装,首先需要安装wheel

    pip install wheel

    然后去官网https://pypi.org/project/lxml/下载lxml对应的的wheel版本, 当前最新版本是lxml 4.9.1, 点击Download files

    在列出的files里面,选出和自己的版本相匹配的,例如你的python版本是3.10的,你的机器是windows系统,64位版本,那么就选lxml-4.9.1-cp310-cp310-win_amd64.whl

    这里比较坑的一点是,python版本最新的已经是3.11版本了,但是lxml没有对应的官方windows 311版本,只有linux下的311版本。可以选择对python版本降级,比如降到python3.10版。

    或者在https://www.lfd.uci.edu/~gohlke/pythonlibs/里,倒是可以找到311版本的windows wheel安装包,可以自行尝试。

    安装wheel包的话,到wheel安装包所在目录执行pip 命令即可,或者带上全路径也可以

    pip install lxml-4.9.0-cp311-cp311-win_amd64.whl

    1.2 安装beautifulsoup4

    推荐使用pip来安装,执行下述安装命令

    pip install beautifulsoup4

    1.3 验证beautifulsoup4能否运行

    执行以下代码,能成功输出hello,就说明可以成功使用beautifulsoup4进行解析了。

    如果只有beautifulsoup4安装成功,lxml库没有正确安装的话,下面代码不能成功执行。

    from bs4 import BeautifulSoup as bs
    
    soup = bs('<p>hello</p>', 'lxml')
    print(soup.p.string)

    补充:Python 安装beautifulsoup4库失败或引用错误的解决办法

    1、首先下载官网BeautifulSoup4软件包里面的beautifulsoup4库

    2、然后解压缩到G:pythonLibsite-packagess4目录下,打开cmd窗口,进入到解压目录下,进入 G:pythonLibsite-packagess4eautifulsoup4-4.3.2eautifulsoup4-4.3.2

    3、在该目录下运行cmd

    python setup.py build
    python setup.py install

    可能会遇到的报错 :error in pymmseg setup command: use_2to3 is invalid.

    报错的解决方案:需要把版本降低,小于58的最后一个版本是57.5.0,pip降一下就可以了:

    pip install setuptools==57.5.0

    就可以重新安装库了

    没遇到报错,直接到这步骤即可

    导入模块(测试模块导入是否成功)

    进入cmd-python输入:

    from bs4 import BeautifulSoup

    注意:导入这个库是要大写的,小写不行。

    标签: python

    热门推荐