首页 > 编程知识 正文

python爬虫自动登录访问授权页面,爬虫实现自动登陆

时间:2023-05-05 07:01:09 阅读:183920 作者:102

http.cookiejar模块
该模块主要的类有 Cookiejar,、 Filecookiejar、 MozillaCooklejar、 LwpCookiejar。这四个的作用分别如下
1.CookieJar:管理HTTPcookie值、存储HTTP请求生成的cookie、向传出的HTTP请求加cookies的对象,整个cookie都存储在内存中,对 Cooklejar实例进行垃圾回收后cookie也将丢失
2. Filecookiejar( filename,delayload=None, policy=None):从 Cookiejar派生而来,用创建 File Cookiejars实例,检索cookie信息并将cookie存储到文件中, filename是存储cookies的文件名, deadload为True时支持延迟访问文件,即只有在需要时读取文件或在文件中存数据。
3 Mozilla Cookiejar( filename,delayload= None, policy=None):从Filecookiejar生来,创建与 Mozilla浏览器cookes.txt兼容的FileCookieJar实例。
4. Lwpcookiejar( ( filename,deadload=None,policy=None):从 Filecookiejar派生而来,创建与 libwww-per标准的 Set-cookie3文件格式兼容的Filecookieja实例。
利用http.cookiejar和request.Httpcookieprocessor登录人人网。相关示例代码如下:
 

from urllib import request,parsefrom http.cookiejar import CookieJarheaders = {    'User-Agent':'Mozilla/5.0 (windows NT 10.0; win64; x64) Applewekit/537.36 (KHTML,like Gecko) Chrome/62.0.3202.94'}def get_opener():    cookiejar = CookieJar()    handler = request.HttpCookieProcessor(cookieJar)    opener = request.build_opener(handler)

 

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。