火车头采集规则教程

2018-07-20    来源:SEO研究协会网

容器云强势上线!快速搭建集群,上万Linux镜像随意使用
1、打开火车头,在界面点击“新建”=》新建站点

火车头采集规则教程

在出现的新界面,填完这两项,然后点击保存。

火车头采集规则教程

列表页就出现了刚才新建的站点

2、右击“aa”站点,选择“新建任务”

火车头采集规则教程

会出现这个界面,首先点击

火车头采集规则教程按钮,



火车头采集规则教程



在出现的新界面中填写信息,找到要采集的文章列表页面 网址一般都是这种形式:http://www.shyestar.com/Yestar/list-12-1.shtml 将文章列表的第二页网址(后面出现规律数字的)网址复制到“类似地址形式”数字变化从2 开始,然后点击添加(这里不要漏下)然后点击完成

火车头采集规则教程

3、

回到原来的页面,在这个框里输入

任意一篇文章内容页的网址,后面的数字设置为通配符,点击“*”即可。

火车头采集规则教程

然后点击这个按钮

火车头采集规则教程

会出现这个界面:

火车头采集规则教程

在左侧网址中任意选择一个,点击右侧的“测试该页”,

火车头采集规则教程

在新界面,除了标题、内容 两项外,右击删除 作者、时间、出处 这几项。(删除标签)

然后分别双击标题和内容两项,

火车头采集规则教程

其中title为文章源代码中文字的开始部分,一般是<div>这种类似的形式,然后找到结束字符,填上即可。(将原来的代码删除。)

Html标签排除这一栏,除了换行、段落不勾选外,其他都勾选。(这里具体哪几个不勾选忘记了 ,你自己多尝试几次),内容一项的设置也一样。点击确定。

5、设置完后,点击这个按钮

火车头采集规则教程

6、点击第三步,开始设置

火车头采集规则教程

在右侧选择要保存的文件位置,

火车头采集规则教程

7、然后点击第四步,找到刚才保存的文件位置,再保存一次。(任务名任意)

火车头采集规则教程

注意:前三步都不要点击“保存”按钮,设置完第四步后,点击保存。

8、回到最开始的页面,右击“aa”文件,选择“从该站点下所有任务的采集”

火车头采集规则教程

然后右侧就会出现这个采集的情况,等采集完毕,打开建的文件,找到保存的.txt 文件。

火车头采集规则教程

标签: seo 代码 建站

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:快速优化关键词排名的法宝

下一篇:网站运营师李云川探讨怎样提升网站排名