测试表明,当我连续提交三份问卷,换一份IP提交三份问卷(即连续提交六份问卷)时,没有触发网站的反爬虫机制。 所以,可以推测对方根据IP提交问卷的频率来识别爬虫程序。 看到这里,你可能觉得我们可以在网上免费代理上提交问卷。 例如这些
那是否意味着将提取免费代理IP的功能添加到python代码中呢? 否否否! 换句话说,在CTF比赛中,你会遇到你的IP来自德国才能拿到flag等主题。 因此,我们的想法是进行包头诈骗,伪造我们的IP,欺骗服务器。 谈谈伪造IP的几种方法。
x -客户端- IP :1.1.1.1
X-Remote-IP:2.2.2.2
X-Remote-Addr:3.3.3.3
X-Originating-IP:4.4.4.4
x前向- for :5.5.5.5
我们都试了一下。 然后可以在后台统计中看到我们的问卷来源
在这里,我们发现X-Forwarded-For可以绕过。 由于以这种方式将X-Forwarded-For字段添加到header信息中,因此更改后的脚本如下所示
执行结果如下
让我们在后台看看统计数据