# 第一个简单例子
以这个页面的采集为例子:
http://demo.bimu.salic.cc/article (opens new window)
# 设置网址规则
首先我们先分析列表页:
http://demo.bimu.salic.cc/article?page=2 (opens new window)
假如我们想抓取第1-10页,这样设置:
接下来,我们设置获取每一个分页的文章列表
我们分析网页结构(用谷歌浏览器)
然后这样设置:
点击测试,可以看到已经获取到文章列表了
# 设置数据获取
比如我们需要采集这篇文章 (opens new window)的标题和内容
我们先在详情页这里设置测试地址:
标题规则可以这样填
div.content-view h1
内容规则:
div#endText
保存规则,然后运行规则
获取到的数据
就这么简单。