网络神采软件是一款体积轻量、简单实用的网页数据采集软件,该软件可以能够帮助用户进行简单便捷的数据采集,通过该软件用户可以能够快速精准的采集各个行业的数据,其中包括企业名录、房屋租售、求职招聘、图书信息、文件下载、搜索插件等信息;网络神采功能强大、方便实用,软件支持网页采集数据进行可视化浏览、网页跳转等功能,可以能够帮助用户简单有效的进行数据采集,该软件绿色安全、免费开源,支持各种数据智能采集,非常适合各个行业的商家进行使用,可以能够帮助商户精准采集数据,方便客户寻找、扩展销售渠道。

软件功能
数据采集
可以能够快速精准的采集各个行业的网页数据
模板设置
可以能够进行默认结果替换、新建任务模板设置
安全与保密
导出任务时删除数据库连接串名称,连接串为全局设置,只需要删除名称
缓存清理
每隔多少分钟清理一次空闲任务缓存,可设置时间进行定时采集频率删除
数据导出
可以能够将采集的数据导出为 Excel、CSV、Word、Access文件格式
采集结果设置
在数据库中找不到对应字段或存储过程参数时忽略错误
从结果文件发布到数据库时,同时删除结果文件中的数据
将发布时的重复行保存到文件
将发布时的出错行保存到文件
软件特色
1、采集强度
支持JS解析、POST分页、登录采集、跨层采集。对于疑难采集页面,有成熟的解决方案。
2、速度快
支持多任务同时运行,每个任务又可以能够设置多线程,确保运行效率。
3、规模化
支持任务多级分类、批量管理。支持云服务器分布式部署,管理员团队协合。
4、流程化
支持定时采集,任务定时自动启动。通过二次开发,实现流程化的信息采集、信息处理。
5、运行稳定
系统运行稳定,要求“0 bug”。目标网页改版后,自动通知管理员。
6、准确性
定制好任务后,采集准确率可达100%,即一条不漏。
使用方法
1、完成软件下载,双击.exe文件即可进行使用,无需安装,点击鼠标右键可以能够进行软件桌面快捷键创建

2、双击软件弹出软件登录弹框,点击输入账号和密码即可进行软件登录

3、完成软件登录进入软件网络数据采集界面,该界面可以能够进行帮助和教程信息进行查看

4、点击根文件夹的文件弹出任务编辑弹框,盖特纳看可以能够进行常规任务设置

5、点击可视化采集采集配置按钮进入软件可视化操作界面,该界面可以能够进行采集数据图片浏览

6、点击提取下一个网址即可对输入的网址数据进行提取

7、点击擦剂规则按钮进入数据采集规则设置界面,该界面可以能够进行数据采集

8、点击数据采集结果按钮进入数据采集结果界面,该界面可以能够设置文件保存方式

9、点击源文件查看器按钮进入文件源代码查看界面进行源文件查看

10、点击选择职位数据采集文档进入数据可视化采集界面,改进可以能够对可视化网页的数据进行采集

11、点击保存导出按钮弹出数据采集文件导出方式列表,点击选择Excel、CSV、Word文件格式进行文件导出

12、点击软件设置按钮弹出软件选项设置弹框,该弹框可以能够进行常用选项设置

13、点击高级选项按钮进入软件高级选择设置界面,该界面可以能够进行软件模板设置

更新日志
2019-08-13 V6.3.15
可视化采集配置,放大、缩小范围时:
1、提取下一网址:默认为连续 * 号,按Ctrl键为单个 * 号
2、循环采集:按Shift键,支持连续 * 号
3、多个 * 号时,加亮显示
可视化采集配置,操作细节:
1、显示完整XPath:选中后,不再取消当前元素,而是直接切换
2、废除选项:复制XPath时覆盖现有,改为:复制XPath时,按Shift键可覆盖现有内容
3、Gecko内核:换回 xulrunner_60.0.26,低版本 xulrunner_45.0.34 仍会出现 COM 断开,体验太差
修复bug:
1、循环采集:整条数据或“关键规则”采集失败后,URL被回收多次
2、切换动态层:从当前层切换到动态层时,如果动态层使用了“模拟点击”,而当前层未使用,会导致“提取下一层XPath时出错: 未将对象引用设置到对象的实例”。
版权声明:网络神采所展示的资源内容均来自于第三方用户上传分享,您所下载的资源内容仅供个人学习交流使用,严禁用于商业用途,软件的著作权归原作者所有,如果有侵犯您的权利,请来信告知,我们将及时撤销。
软件下载信息清单:
驱动文件名称 | 发布日期 | 文件大小 | 下载文件名 |
---|---|---|---|
网络神采安装包 | 2024年11月30日 | 12.2 MB | bgetpub.zip |
软件评论