首页 > 编程知识 正文

Python 网站扒图片

时间:2023-11-19 16:48:36 阅读:302753 作者:OGUZ

这篇文章将详细介绍如何使用 Python 扒取网站上的图片。

一、准备工作

在开始扒取网站上的图片之前,我们需要预先安装几个必要的 Python 库。请确保你已经安装了以下库:

pip install requests
pip install beautifulsoup4

安装完成后,我们就可以开始编写扒取图片的代码了。

二、获取网页内容

首先,我们需要使用 requests 库来获取网页的内容。这里我们以获取百度首页为例:

import requests

url = 'https://www.baidu.com'
response = requests.get(url)
html = response.text

print(html)

运行上述代码,我们可以看到百度首页的 HTML 代码。

三、解析网页内容

接下来,我们需要使用 beautifulsoup4 库来解析网页的内容。这里我们以解析图片的链接为例:

from bs4 import BeautifulSoup

soup = BeautifulSoup(html, 'html.parser')

# 找到所有的图片标签
img_tags = soup.find_all('img')

# 获取所有图片的链接
img_links = []
for img in img_tags:
    img_links.append(img['src'])

# 打印图片链接
print(img_links)

运行上述代码,我们可以得到百度首页所有图片的链接。

四、下载图片

最后,我们需要下载网站上的图片。这里我们以将图片保存到本地为例:

import os

# 创建文件夹
if not os.path.exists('images'):
    os.makedirs('images')

# 下载图片
for i, link in enumerate(img_links):
    response = requests.get(link)
    with open(f'images/image_{i}.jpg', 'wb') as f:
        f.write(response.content)

运行上述代码后,我们可以在当前目录下的 images 文件夹中找到所有下载的图片。

五、总结

通过以上步骤,我们成功地使用 Python 扒取了网站上的图片。你可以根据需要修改代码,适应不同的网站和需求。祝你扒取愉快!

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。