首页 > 编程知识 正文

真漂亮,python实战案例

时间:2023-05-04 04:04:09 阅读:153846 作者:19

要爬网的网址:

33558 www.zdqx.com/qingchun/index.html

不用说,直接坐代码:

import requestsimport re,OS headers={ ' user-agent ' : ' Mozilla/5.0 (windows nt 10.0; WOW64 ) appleWebKit/537.36(khtml,like Gecko ) chrome/78.0.3904.108 safari/537.36 )、' referer ' 3360 ' 3358 www hm _ lpvt _ 303 a 32038183 ef a6 D8 efec 90 c 0031 b 87=1581472912 ' } defget _ URLs (URL, num_page ) 3360 response=requests headers=headers (response.encoding=response.apparent _ encoding result=re.FIEs ) ) ' target='_blank' title='(.*? ()、str(result )、re.S ) pagenumlist=re.findall )、em class=(page _ num )共).*? (张/em )、str(result )、re.S ) for urlAndTitle,numinzip ) urlstitlelist, pagenum list (: URL=' http : ' urlandtitle (0) title=urlandtitle )1) num=int ) for page in range(1) 1, num 1) : if page==1: newurl=URL else : newurl=URL.replace ('.html ',' _%s.html'%page ) requ sp=hell (/div )、resp.text、re.S ) URL_alt=re.findall ) ' imgsrc=' ).*? ()、str(div_main )、re.S ) )长度为3 _ URL=' http : ' URL _ alt (1) imgtitle=titlestr ) page ) savedata ) headers=headers (response.encoding=response.apparent _ encodingwithopen (path '/' title '.jpg ), mode='wb' (f.close ) ) defdownload_page(num_page ) : ifnum _ page==1: URL=' http://www.zdqx.com/com index_'str(num_page ).html'get_URLS ) URL,num_page ) print ) (num_page )页面收集完毕(def main _ def main ) (共1-42页),键入“all”可获得约10000张高清壁纸:(n ) ) if ) want _ page=(all ) ) 3360forpageinrange(1, 41 ) :download_page(page ) try:num_page=int ) want_page ) except :打印(您的输入无效,纯数字或字符串' all ) 请重新输入' (main_run ) (if(num_page1ornum_page42 ) : print ) )您的输入无效,页码只能在1到42之间。 请重新输入() (main_run ) ) else33332

虽然取大约10000张高清晰度图像已经太晚了,但是取一页的时间总算可以接受。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。