首页 > 编程知识 正文

python 爬虫爬不到片,python爬虫爬出的打不开

时间:2023-05-04 07:59:27 阅读:247136 作者:2180

代码是这样的:

import urllib2

import re

import urllib

url ="http://www.zhangzishi.cc/20151004mt.html"

定义Header,模拟浏览器向服务器发起请求

headers = {

"User-Agent": "Mozilla/5.0 (Windows NT 6.3; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36",

"Host": "cdn.zhangzishi.cc",

'Referer': 'http://www.zhangzishi.cc/20151004mt.html',

"GET": url

}

request = urllib2.Request(url,None,headers)

获取网页html信息

response = urllib2.urlopen(request)

正则匹配图片特征,并获取图片链接

img_tag = re.compile(r'src="(.+?.jpg)"')

img_links = re.findall(img_tag,response.read())

下载图片

img_counter = 0

for img_link in img_links:

img_name = '%s.jpg' % img_counter

urllib.urlretrieve(img_link,"E:LearnPythonpictures%s" % img_name)

img_counter += 1

下载下来的图片是这样的:

任意打开一个图片,是这样的:

我调试了一下,发现图片的链接是:

所以,我想问一下,如何下载图片呢

历史中提交的图片或压缩文件

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。