爬山虎采集器 爬山虎采集器 v3.0.2.7下载

分类:其他杂类 大小:56.5 MB 更新日期:2024年11月13日
本站评级:★★★★☆ 语言:简体中文 授权版本:官方免费 运行环境:Windows 11,Windows 10,Windows 8,Windows 7

爬山虎采集器 爬山虎采集器 v3.0.2.7


爬山虎采集器一款简单易用、功能强大的数据采集工具。无需学习编程,点击式界面,自动生成采集脚本,可以能够采集互联网99%的网站。

爬山虎采集器

功能介绍

向导模式

简单易用,轻松通过鼠标点击自动生成

脚本定时运行

可按照计划定时运行,无需人工

独创高速内核

自研的浏览器内核,速度飞快,远超对手

智能识别

对于网页中的列表、表单结构(多选框下拉列表等)能够智能识别

广告屏蔽

定制的广告屏蔽模块,兼容AdblockPlus语法,可添加自定义规则

多种数据导出

支持Txt 、Excel、MySQL、SQLServer、SQlite、Access、网站等

常见问题

问:如何过滤列表中的前N个数据?

1.有时我们需要对采集到的列表进行过滤,比如过滤掉第一组数据(在采集表格时,过滤掉表格列名)

2.点击列表模式菜单中的,设置列表xpath

问:如何抓包获取Cookie,并且手动设置?

1.首先,使用谷歌浏览器打开要采集的网站,并且登陆。

2.然后按下 F12,会出现开发者工具,选择 Network

3.然后按下F5,刷新下页面, 选择其中一个请求。

4.复制完成后,在爬山虎采集器中,编辑任务,进入第三步,指定HTTP Header。

如何自动分析抓取数据?

输入采集网址

打开软件,新建任务,输入需要采集的网站地址。

智能分析,全程自动化提取数据

进入到第二步后,爬山虎采集器全自动智能分析网页,并且从中提取出列表数据。

导出数据到表格、数据库、网站等

运行任务,将采集到的数据导出为Csv、Excel以及各种数据库,支持api导出。

更新日志

3.0.2.7

2021/4/6

修复编辑器中ua不生效问题

修复自定义时间为24小时制

修复任务结束后,无法访问已释放对象的问题

完善发布到qq的问题检测

修复运行时设置cookie不生效问题

优化已经过滤的url不深入

版权声明:爬山虎采集器所展示的资源内容均来自于第三方用户上传分享,您所下载的资源内容仅供个人学习交流使用,严禁用于商业用途,软件的著作权归原作者所有,如果有侵犯您的权利,请来信告知,我们将及时撤销。


软件下载信息清单:


驱动文件名称 发布日期 文件大小 下载文件名
爬山虎采集器安装包 2024年11月13日 56.5 MB PashanhuV2Setup.zip
下载地址:

相关推荐: 驱动大全 / 软件下载

软件评论

昵称*

手机*

网址

驱动总数
22526+
文章总数
3520+
评论条数
265+
运行天数
300+