⑴网络神采是一款体积轻量简单实用的网页数据采集软件,该软件可以帮助用户进行简单便捷的数据采集,通过该软件用户可以快速精准的采集各个行业的数据,其中包括企业名录房屋租售求职招聘图书信息文件下载搜索插件等信息;网络神采功能强大方便实用,软件支持网页采集数据进行可视化浏览网页跳转等功能,可以帮助用户简单有效的进行数据采集,该软件绿色安全免费开源,支持各种数据智能采集,非常适合各个行业的商家进行使用,可以帮助商户精准采集数据,方便客户寻找扩展销售渠道。
⑵可以快速精准的采集各个行业的网页数据
⑶可以进行默认结果替换新建任务模板设置
⑷导出任务时删除数据库连接串名称,连接串为全局设置,只需要删除名称
⑸每隔多少分钟清理一次空闲任务缓存,可设置时间进行定时采集频率删除
⑹可以将采集的数据导出为 ExcelCSVWordAess文件格式
⑺在数据库中找不到对应字段或存储过程参数时忽略错误
⑻从结果文件发布到数据库时,同时删除结果文件中的数据
⑼将发布时的重复行保存到文件
⑽将发布时的出错行保存到文件
⑾支持JS解析POST分页登录采集跨层采集。对于疑难采集页面,有成熟的解决方案。
⑿支持多任务同时运行,每个任务又可以设置多线程,确保运行效率。
⒀支持任务多级分类批量管理。支持云服务器分布式部署,管理员团队协合。
⒁支持定时采集,任务定时自动启动。通过二次开发,实现流程化的信息采集信息处理。
⒂系统运行稳定,要求“ bug”。目标网页改版后,自动通知管理员。
⒃定制好任务后,采集准确率可达%,即一条不漏。
⒄完成软件下载,双击.exe文件即可进行使用,无需安装,点击鼠标右键可以进行软件桌面快捷键创建
⒅双击软件弹出软件登录弹框,点击输入账号和密码即可进行软件登录
⒆完成软件登录进入软件网络数据采集界面,该界面可以进行帮助和教程信息进行查看
⒇点击根文件夹的文件弹出任务编辑弹框,盖特纳看可以进行常规任务设置
⒈点击可视化采集采集配置按钮进入软件可视化操作界面,该界面可以进行采集数据图片浏览
⒉点击提取下一个网址即可对输入的网址数据进行提取
⒊点击擦剂规则按钮进入数据采集规则设置界面,该界面可以进行数据采集
⒋点击数据采集结果按钮进入数据采集结果界面,该界面可以设置文件保存方式
⒌点击源文件查看器按钮进入文件源代码查看界面进行源文件查看
⒍点击选择职位数据采集文档进入数据可视化采集界面,改进可以对可视化网页的数据进行采集
⒎点击保存导出按钮弹出数据采集文件导出方式列表,点击选择ExcelCSVWord文件格式进行文件导出
⒏点击软件设置按钮弹出软件选项设置弹框,该弹框可以进行常用选项设置
⒐点击高级选项按钮进入软件高级选择设置界面,该界面可以进行软件模板设置
⒑可视化采集配置,放大缩小范围时:
⒒提取下一网址:默认为连续 * 号,按Ctrl键为单个 * 号
⒓循环采集:按Shift键,支持连续 * 号
⒔多个 * 号时,加亮显示
⒕可视化采集配置,操作细节:
⒖显示完整XPath:选中后,不再取消当前元素,而是直接切换
⒗废除选项:复制XPath时覆盖现有,改为:复制XPath时,按Shift键可覆盖现有内容
⒘Gecko内核:换回 xulrunner_..,低版本 xulrunner_.. 仍会出现 断开,体验太差
⒙循环采集:整条数据或“关键规则”采集失败后,URL被回收多次
⒚切换动态层:从当前层切换到动态层时,如果动态层使用了“模拟点击”,而当前层未使用,会导致“提取下一层XPath时出错:
⒛未将对象引用设置到对象的实例”。