首页 > 编程知识 正文

获取谷歌浏览器的url,谷歌浏览器提取网页片

时间:2023-05-03 16:47:40 阅读:216902 作者:1762

总述:

一开始接触爬虫的时候,一个元素的定位能让我纠结半天。定位有很多种,我觉得最好用的是xpath,在这里分享一个用谷歌浏览器自动定位元素的trick,以后定位元素只需要复制就可以了。

第一步:找到在网页上定位元素

找到你需要定位的元素,右键-》检查,那么谷歌浏览器的有边框就会跳到相对应的元素位置。如图:

我右键点击了话题榜,然后代码就自动跳到了话题榜所在的元素。

第二步:复制xpath

在检查的代码里面点击你需要定位的元素,右键-》copy->xpath就可以了

 这样子的话,你接下来在代码里面可以crtl+v复制一下,得到的就是这一个元素的xpath位置:

//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[2]/span

注意在使用的时候,xpath需要包含在单引号里面,不能是双引号。

 ok,这个单个元素,那么问题来了,有时候我们需要某一类元素怎么办呢?

我们可以来观察一下这个微博界面:有话题榜,热搜榜,新时代。。。几个小标题,我们来看一看他们的xpath。

//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[1]/span//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[2]/span//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[3]/span//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li[4]/span

发现什么规律没有,对了,只有倒数第二个元素li元素的下标不太一样。那么如果你想获取所有的小标题,你把下标去掉就可以了。

//*[@id="app"]/div[1]/div[1]/div[2]/div[2]/div[1]/div/div/div/ul/li/span

以上。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。