主页 > 教程合集 > 工具推荐 >

火车头采集中列表页及标签Xpath可视化提取功能的使用

时间:2018-11-09 阅读:0

Xpath可视化提取功能旨在做到用户所见即所得,仅仅通过鼠标点击进行规则配置。但是此功能不适合大部分网站。

火车头采集中列表页及标签Xpath可视化提取功能的使用

1, 使用Xpath方式获取地址

在第一步,我们通过Xpath方式来获取内容页地址

火车头采集中列表页及标签Xpath可视化提取功能的使用

如上图,选择“使用Xpath方式获取地址”,选中后右侧有个“使用Xpath浏览器”按钮,点击下。

火车头采集中列表页及标签Xpath可视化提取功能的使用

在地址栏里面输入列表页地址,然后点击右侧绿色的按钮,使用这个浏览器来访问我们要采集的列表页地址。

火车头采集中列表页及标签Xpath可视化提取功能的使用

点击上图的那个红色标志的箭头,然后鼠标放到浏览器内就有个淡蓝色的框,表示被选中的部分,那么要选中那一部分才行呢?看下图

火车头采集中列表页及标签Xpath可视化提取功能的使用

当淡蓝色框选中的部分,在左下角能显示出文章地址,就说明这个淡蓝色的框选择的就合适,然后鼠标在选中的框那里轻轻点击下,不需要点击访问内容页,只需要点击下就可以。

这里看到点击后,看下图有个变化:

火车头采集中列表页及标签Xpath可视化提取功能的使用

和上图这个地方不一样,变成初始状态了,下面要把上述操作再做一遍,也是首先点击这个,再选中标题。要注意。

然后我们再随便找个标题按照上面的步骤再做一遍,这一步非常的重要,必须要重复做2遍。

火车头采集中列表页及标签Xpath可视化提取功能的使用

然后如上图点击测试,如果测试结果正确,就点击确定按钮

火车头采集中列表页及标签Xpath可视化提取功能的使用

Xpath表达式就自动填写好了。

如果测试提示结果如下图:

火车头采集中列表页及标签Xpath可视化提取功能的使用

上面说了这个方式不适合所有的网站,如果有上图提示,说明没有办法使用这个方式来采集,目前也没有办法解决,请你换别的方式采集。

如果这篇博文对你有帮助,希望您可以打赏给博主余斗,以支持余斗继续坚持下去!

余斗个人博客打赏二维码

余斗余斗
  • 版权声明:原创文章由发表在工具推荐分类下,2018-11-09最后更新,转载注明出处。

相关推荐

返回顶部