首页 > 编程知识 正文

抖音快手爬虫,抖音代码教程简单

时间:2023-05-04 00:08:31 阅读:244832 作者:642

**有问题加QQ:1016401546(说明来意)
源代码下载:

链接:https://pan.baidu.com/s/12gFPgtci4BBBDrQDk3q8yA 提取码:6as2 复制这段内容后打开百度网盘手机App,操作更方便哦 一、抖音爬取教程 1、获取抖音博主个人url

手机打开小美满的战斗机的抖音主页,右上角打开【…】----【分享】----【复制链接】

如下图:

我们复制出来的链接是这样的(这是短连接,每次复制出来的都不一样):
在抖音,记录美好生活! https://v.douyin.com/e16EVxG/
用电脑浏览器打开会被还原原始的长URL,但是对我们没有多大的用处:
https://www.iesdouyin.com/share/user/58544496104?did=66967946840&iid=3342935555581079&sec_uid=MS4wLjABAAAAzzmS2TgIEvxGftMpWD13Ty8k5HmsjlGsLJ1yBUEm2Ew&u_code=19emjdgkd&timestamp=1614005017&utm_source=copy&utm_campaign=client_share&utm_medium=android&share_app_name=douyin

2、找出视频的sec_uid和max_cursor

sec_uid:用户唯一标识
max_cursor :视频偏移度,即可以通过这个值来获取剩下的视频
按【F12】打开检查代码页面,点击博主【喜欢】的视频,右边可以看到请求链接,但是浏览器刷不出视频,所以无法下载用户喜欢的视频,只能下载用户上传的视频。
也可以通过fiddler去取出来

再点击【作品xxx】,可以看到like的链接下面有一个作品的请求链接(post),这个就是我们要用的链接。

直接把post的请求链接在浏览器打开,可以看到返回很多信息,包括has_more(是否还有更多),max_cursor和视频真实url等。后面我们就是使用这个URL来下载视频。

post链接请求下面可以看到我们要找的两个值:

首次请求的时候使用max_cursor = 0 ,后续根据has_more和max_cursor 的返回值继续请求剩下的视频,然后加到数组里面,遍历下载。

3、抖音爬取效果:

4、下载的视频:

二、快手爬取教程

说明:
问题1:因为快手那边有限制(有时候爬取了几十个视频就请求异常,得到的返回结果是提示输入验证码的HTML代码),具体限制了什么还不知道,已尝试更换代理ip请求和修改cookies、请求头等信息仍无法解决。一个ip应该可以爬取几百个快手视频。

如我们随便找一个视频不多也不少的主播来爬一下:是ygdhm

1、复制博主链接

打开【手机快手APP】,搜索指定的主播名称,进入主播主页,如下图在主页也可以看得到主播的【用户ID(快手ID)】
点击右上角分享-→复制链接

短连接如下:
看了这么多快手,还是「是ygdhm」最好玩了! https://v.kuaishou.com/cvY1ZA 复制此消息,打开【快手】直接观看!

2、获取cookie did号

用电脑浏览器打开该短链接,按【F12】,刷新页面,随便找一个m_graphpl 打开,看右边的Cookie 可以看到 你的 did。

3、快手爬取效果 4、下载的视频:

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。