首页 > 编程知识 正文

python网站开发实例,python网络爬虫开发实战

时间:2023-05-03 17:54:25 阅读:143085 作者:1567

首先利用Python模拟在淘宝网上注册。 不说多余的话。

开心地开始吧~

开发工具Python版本:3.6.4

相关模块:

re模块

操作系统模块

请求模块;

也有Python附带的模块。

环境生成只需安装Python并添加到环境变量中,安装pip安装所需的相关模块即可。

注册流程分析首先向家里展示淘宝注册请求的时序图,便于大家理解

备注:淘宝ua参数: ua (用户代理)旧名用户代理,淘宝的ua参数通过输入浏览器、ip、电脑、时间等信息加密生成,在很多地方使用。 不仅仅是登录。

代码层面考虑将模拟登录淘宝分为以下四个步骤

输入用户名后,浏览器会向淘宝(taobao.com)发送post请求,判断是否会发生滑块验证! 用户输入密码后,浏览器还会向淘宝(taobao.com)发出post请求,验证用户名密码是否正确,如果正确,则返回token。 浏览器拿着token去阿里巴巴(alibaba.com)交换st代码! 浏览器获得st码后,拿着st码获取cookies,登录成功实现伪登录1 .判断是否需要验证码目前我们在登录淘宝的时候,大部分情况下不会出现滑块验证码。 即使多次尝试登录后结束,中途也只出现一次。 到底是什么控制着是否需要滑块认证码呢?

如上图所示,输入用户名后,浏览器将启动post请求,确认是否需要滑块验证码,返回true后将显示滑块验证码。 否则不会出现,一般不会出现! 从照片中可以看到,在这次的post请求中上传了username、ua这两个参数。如上所述,因为ua是浏览器、ip、设备信息等多信息加密参数,所以淘宝的

例如,您可能在某个设备上注册了大量帐户。 此时,淘宝可以从ua参数中获取设备编号,并限制该设备。

知道流程和请求的链接和参数后,可以用代码请求!

2 .验证用户名和密码,这里的第一步是以上时序图的步骤5。 要求登录。 在此,将用户名、ua参数、加密密码等30多个参数post发送到淘宝(taobao.com)进行验证。

试着用代码来实现吧。 很多参数不要被吓到。 我从浏览器里复印了。

求结果

可以看到申请st码链接后面有token

3 .在申请ST码方面我们已经申请了淘宝(taobao.com)上的token。 这一步是用ST代码交换token。 来这里可能会有很多人有疑问。 为什么淘宝注册这么麻烦呢? 直接登录taobao.com不就可以了吗? 为什么要在taobao上验证用户名密码,通过后再去alibaba.com登录换取st代码呢? 我觉得任何公司架构都是慢慢演变的结果,最初的淘宝注册没那么复杂。 但是,随着阿里巴巴的逐渐壮大,很多业务线分开了。 但是,这些事业线之间有关联性。 例如,用户登录了淘宝账号之后天猫就不需要再登录(请注意,淘宝和天猫的顶级域名不同,所以不能共享cookis。 )为了实现这个功能,出现了单点登录

单点登录(Single Sign On )简称SSO,是目前流行的企业业务集成解决方案之一。 SSO的定义是,在多个APP应用程序系统中,用户可以通过一次登录访问所有相互信任的APP应用程序系统。 ——百度百科

很多大公司几乎都是单点登录,但阿里的单点登录系统一定是母公司阿里巴巴(alibaba.com)做的。 所有子公司都去调用母公司的接口。 分析淘宝注册为什么这么复杂就明白了。 因为用户数据在淘宝上,所以现在淘宝(taobao.com)需要验证用户名和密码。 验证生成token,浏览器拿着token申请阿里巴巴) alibaba.com)和单点登录代码) st代码),了解阿里巴巴接受验证请求,token通过后返回st代码的设计原理后,即可返回st代码

4 .用st码登录成功获取st码后,即可登录。 这一步是获取用ST代码登录的cookie。

到了这个地步,我们已经成功注册淘宝了!

5 .获取淘宝网名实际上,如上所述,我们已经登录淘宝返回用户主页链接。 我们请求淘宝用户的主页,以进一步验证登录成功。 顺便把淘宝的昵称拿出来吧。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。