神箭手云爬虫是款专业的网页数据抓取工具。他可以帮助用户对站点的页面数据进行批量采集,过程全自动,非常智能,帮助用户能够快速收集到想要的情报。
【使用方法】
登录神箭手客户端——>创建点选模式的爬虫——>点选要爬取的数据——>启动爬虫
步骤一登录神箭手客户端
打开安装好的神箭手客户端,输入神箭手账号和密码,登录进入控制台
步骤二创建点选模式的爬虫
点击“新建应用”>选择“爬虫”,点击“下一步”>选择“自己开发”>选择“点选模式”。输入爬虫名称,点击”创建”
步骤三点选要爬取的数据
1、打开创建的爬虫,进入打开点选面板
2、在点选面板中,进行点选操作
首先,输入一个包含所需数据的url,回车加载显示内容:
然后,在显示的网页内容中,点击选择要采集的数据,比如选择采集文章的标题和内容:
点击左侧的高级设置,可以设置爬虫的列表页、内容页url正则表达式、是否自动JS渲染等,提高爬虫效率:
步骤四启动爬虫
完成点选后,点击开始爬取。稍等一会,爬虫就会自动开始运行了
【软件技巧】
点击点选面板的查看代码,可以随时查看点选自动生成的爬虫代码,可以拷贝代码到编程模式的爬虫内,进行二次开发