# 第一个简单例子

以这个页面的采集为例子:

http://demo.bimu.salic.cc/article (opens new window)

# 设置网址规则

首先我们先分析列表页:

http://demo.bimu.salic.cc/article?page=2 (opens new window)

假如我们想抓取第1-10页,这样设置:

接下来,我们设置获取每一个分页的文章列表

我们分析网页结构(用谷歌浏览器)

然后这样设置:

点击测试,可以看到已经获取到文章列表了

# 设置数据获取

比如我们需要采集这篇文章 (opens new window)的标题和内容

我们先在详情页这里设置测试地址:

标题规则可以这样填

div.content-view h1

内容规则:

div#endText

保存规则,然后运行规则

获取到的数据

就这么简单。

本教程的规则下载 (opens new window)

Last Updated: 11/27/2021, 1:20:06 AM