禁用JavaScript获取网页文本1、背景2、具体操作步骤(1)打开开发人员工具;2 )禁用JavaScript;3 )整个流程的演示3、总结和说明
一.背景
我在找资料的时候,看到了一个很有价值的文字,我提示在准备用于论文的时候,这个文字是不能复制的。 (某文库用于把戏。 自己用手敲一下吧。 虽然有点麻烦,但是看了我这篇文章,应该能大幅度解决你的烦恼。
要解决不能复制字符的问题,拍QQ截图来识别字符应该是很多人最常见的方法。 虽然它简单实用,但我今天主要想谈谈禁用网页的JavaScript
二、具体操作步骤(1)打开开发者工具,点击F12快捷键直接打开开发者工具,大部分电脑都可以用这个快捷键直接打开。 按F12后,浏览器的右上角会出现如下图所示的界面。 点击打开开发工具,点击成功打开界面如下:
注:这个界面功能很大,这里不详细介绍。 如果学习Python爬虫,对这个页面的要求会很高。 此时,请只注意上图中我边框的齿轮位置。
如果F12快捷方式无法打开开发人员工具,请在网页上单击鼠标右键,然后单击底部的检查选项
)2)禁用JavaScript,点击上图齿轮,界面如下
)3)整个流程演示禁用JavaScipt演示
解除禁用JavaScript演示
说明:查看上面两张gif图像,可以清楚地看到JavaScript禁用和取消禁用前后的区别; 如果禁用并刷新JavaScript格式,我写的内容会立即消失。 解除禁用并刷新后,内容将再次出现。
三、这种直接在网页端禁用JavaScipt的方法优点是方便的,但缺点也很明显。 那就是说只适用于一部分网站。 这意味着所有站点都可以禁用,但不是所有站点都禁用后才能复制页面字符,而是有一定的限制。
因此,基于这种情况,Python爬行动物非常重要。 优秀的爬虫技术人员只要获取网页文字就非常简单,在今天大数据和人工智能的推动下,大家好好学习Python吧。说明
此次操作基于系统上搭载的浏览器Edge。 该浏览器内核的本质是谷歌内核,运行速度和稳定性比较OK。 如果现在也有朋友在使用Sogou、QQ浏览器、360等浏览器,博客强烈推荐早点放弃,谷歌浏览器是非常好的选择。
博主只提供了一种方法,采用QQ截图Ctrl Alt A直接识图、在页面源代码中查找文字等方法可以在一定程度上解决问题。 但我相信在我所有的方法中,Python爬行动物一定是最受青睐的(虽然可能不是最快的)。
Google浏览器下载地址: Google Chrome 注:我不知道文中的gif图像是为了什么bug。 一开始我直接上传了图片,但发现上传的只有一张图片,没有视频效果。 稍后找资料,发现直接把图像拖到MarkDown格式就可以了。
最后,由于博客的能力有限,文中不可避免地存在不足之处。 期待大家的指正。