欢迎来到w88模板网!
dedecms自带采集插件详细图文教程

dedecmsw88自带采集插件详细图文教程

浏览次数: 0

作者: w88模板网

信息来源:

更新日期: 2017-10-23

文章简介

看到很多网友都为w88(DEDE CMS)的采集教程头疼,的确,官方出的教程太笼统了,什么都没说,换个网站你什么都做不了,这个教程是最详尽的教程,让你一看即会 首先我们打开w88后台点击 采集——采集节点管理——增加新节点 这里我们以采集普通文章为例,我

  • 正文开始
  • 热门文章

看到很多网友都为w88(DEDE CMS)的采集教程头疼,的确,官方出的教程太笼统了,什么都没说,换个网站你什么都做不了,这个教程是最详尽的教程,让你一看即会


首先我们打开w88后台点击 采集——采集节点管理——增加新节点


 
这里我们以采集普通文章为例,我们选择普通文章,然后确定


 
我们进入了采集的设置页面,填写节点名称,就是给这个新节点取个名字,这里你可以任意填写。
然后打开你想要采集的文章列表页,这里我们以w88官网为例https://www.dedecms.com/web-manage/jianzhanxinde/打开这个页面,右键——查看源文件
 
找到目标页面编码,就在charset后面


 
页面基本信息其他的一般就不用管了,填完了如图
 


现在我们来填写列表网址获取规则
看看文章列表第一页的地址https://www.dedecms.com/web-manage/jianzhanxinde/list_49_1.html
对比第二页的地址https://www.dedecms.com/web-manage/jianzhanxinde/list_49_2.html
我们发现了他们除了49_后面的数字不一样,其他的都一样,所以我们可以这样写
https://www.dedecms.com/web-manage/jianzhanxinde/list_49_(*).html
就是把1换成了(*) 因为这里只有2页,所以我们就填从1到2 每页递增当然是1了,2-1...是等于1吧
这里我们就填写完了 


可能大家采集的有些列表没有规则,那就只有手工指定列表网址了,如图
 


每行写一个页面地址
列表规则写完了,我们就开始写文章网址匹配规则了,回到文章列表页
右键查看源文件 找到区域开始的HTML,就是找文章列表开始的标志。


 


我们很容易的找到了如图中的“新闻列表” 。从这里开始,后面就是文章列表里
我们再找文章列表结束的HTML


 


就是这个了,一个很容易找到的标志


如果链接中含有图片: 不处理 采集为缩略图 这里根据自己的需要选择
对区域网址进行再次筛选:
(使用正则表达式) 

必须包含: (优先级高于后者)
 不能包含:


打开源文件,我们可以很清楚的看到,文章链接都是以.html结束的
所以,我们在必须包含后面填.html 如果遇到有些列表很麻烦,还可以填写后面的不能包含


 


 
我们点击保存设置进入下一步,可以看到我们获得的文章网址
看到这些就是对的了,我们保存信息进入下一步设置内容字段获取规则
我们看看文章有没有分页,随便进入一篇文章看看。。我们看到这里的文章没有分页
所以这里的我们就默认了


 


我们现在来找文章标题等等 随便进入一篇文章,右键查看源文件
看看这些 

 


依照源码填写 

 


我们再来填写文章内容的开始,结束
和上面的一样,找到开始和结束标志
开始: 

 


结束: 


 

 


你想过滤文章中的什么内容就到过滤规则里写吧,比如要过滤文章中的图片

 


选择常用规则 

 


再勾选IMG  然后确定
这样我们就把正文中的图片过滤了
设置完毕后点保存设置并预览


 


这样一个采集规则就写好了,很简单吧有些网站很难写,可要多下点功夫了哦
我们点保存并开始采集——开始采集网页 一会的功夫就采集完了


 


我们看看我们采集到的文章 


 

 


456 
看来是成功了,我们导出数据吧 


 


 
  首先选择要导入到的栏目,按“请选择”那里即可在弹出的窗口中选择你需要导入的栏目发布选项这里一般默认即可,除非你不想马上发布。每批导入默认是30条,这里修改与否都无所谓,附带选项一般选“排除重复标题”,至于自动生成HTML那个选项建议先别生成,因为我们还要去批量提取摘要和关键字。

w88二次开发QQ群

本站客服QQ号:,群号(383578617) 如果您有任何w88问题,请把问题发到群里,阁主将为您写解决教程!

转载请注明: w88模板 » dedecmsw88自带采集插件详细图文教程

  • DedeCMS教程QQ群
    阅读
    用 w88建站 会手机站首页不更新的苦恼,每次 PC 更新,要去删除 m 目录下的 index.html ,手机站首页才会更新,这样很麻烦,通过以下修改,让手机站首页是动态的,不生成 index.html , PC 端更新后,手机端首页自动更新。 把 \m\index.php 里面的 $row[sho...
  • dedecms手机站m目录下不生成index.html实现动态更新
    阅读
    w88系统安装好后,进入后台,出现Fatal error: Call to undefined function make_hash() in /dede/sys_info.php on line 201 一般出现这个问题是因为升级网站引起的。我们可以直接把错误提示这段代码删除或者屏蔽就行了。 打开/dede/sys_info.php,找到201...
  • Fatal error: Call to undefined function make_hash() in /dede/sys_info.jpg on line 201的解决方法
    阅读
    网上很多教程都是用 dedecms 自带的邮件库发送邮件,而且是写死要发送的字段内容,今天我们用 phpmailer 来给站长发送自定义表单提交的数据到指定邮箱上 (QQ 邮箱, 163 邮箱都可以 ) ,不写死任何东西,有什么字段就提交发送什么字段。 操作之前,我们要先...
  • dedecms提交自定义表单后发送到指定邮箱
    阅读
    有时我们看到别人家的w88dedecms网站有打赏功能,是不是羡慕嫉妒恨呢?今天我来给大家讲讲w88网站怎么添加支付宝、微信打赏功能。 二、首先登陆畅言后台(没有畅言账号的首先注册账号) 三、进入后台,找到实验室--打赏 四、设置配置信息,保存。 五、复制...
  • dedecms网站添加打赏功能
    阅读
    最近有粉丝说,之前用的火车头发布文章时,用免登陆接口在PHP7.0环境中显示空白,于是今天抽空更新了一下插件(话说,DedeCms早期版本无法在PHP7.X运行,用最新版的!),那么接下来的代码就是插件发布模块无须变更,只需要变更接口插件就可以了 ?php/*/////...
  • Dedecms 5.7 火车头采集免登陆发布接口适配PHP7.X插件
    阅读
    当前很多人用w88dedecms系统建站,多城市分站对地方性长尾关键词和全国市场的推广有着很大的帮助,今天和大家分享下如何实现w88dedecms系统多城市分站功能。 方法/步骤 w88dede城市分站有三种方法: 第一种是建立N多个模板,有多少个城市建立多少个模板,...
  • dedecms系统多城市分站功能开发思路
    阅读
    最新的w88dedecms程序手机版下一篇变上一篇而且还出错Request Error!,这是因为官方写错了一个地方 打开 /include/arc.archives.class.php 找到 $mlink = view.php?aid=.$preRow[id]; 注意:这个文件里面有2个上面的代码,真正要改的是大概在 839 行 改成 $...
  • 手机站下一篇变上一篇而且还出错Request Error!
    阅读
    w88导航栏目高亮代码如下: {dede:field name=typeid runphp=yes} if(@me==8) @me=1; else @me=0; {/dede:field} 导航的写法, 比如:lia href={dede:type typeid=7}[field:typelink /]{/dede:type} {dede:field name=typeid runphp=yes} if(@me==7) @me=cl...
  • 获取当前栏目id并判断使当前导航栏目高亮
    阅读
    w88小说站上一章节下一章节实现方法,通过修改include/arc.archives.class.php这个文件来实现这样的效果: 实现原理:通过writer作者栏来匹配所有章节,然后根据文章ID排序来实现w88小说文章上一章节下一章节。 部分代码截图: 附:arc.archives.class.php...
  • 小说站上一章节下一章节修改arc.archives.class.jpg的实现方法
    阅读
    最近用w88dedecms程序采集文章时候,发现每次采集都要去后台更新一下文章、栏目、上下篇以及首页,操作起来真心麻烦,后面在网上收集了一些代码以及经过自己调试,发现居然可以自动更新文章页以及栏目、首页。真心爽,这样子就能稳稳的挂机采集了哈。这是免...
收藏此文 打赏本站

如本文对您有帮助,就请w88模板网抽根烟吧!

  • 支付宝打赏
    火车头采集免登陆接口采集文章后自动更新栏目、首页、文章页,实现自动化采集
    微信打赏
    支付宝扫描打赏
w88arclist标签实现分页的方法
« 上一篇 2017年10月23日
w88删除服务器中多余的没有被调用的图片
下一篇 » 2017年10月23日

精彩评论

微信扫描打赏
有问题在这里提问,阁主会为你解决!
  • 全部评论(0
    还没有评论,快来抢沙发吧!
推荐w88插件更多
更新时间:2017-09-04

人已经看过了!

更新时间:2019-09-10

人已经看过了!

更新时间:2018-12-05

人已经看过了!

更新时间:2019-07-13

人已经看过了!

更新时间:2017-08-29

人已经看过了!

更新时间:2019-05-28

人已经看过了!

更新时间:2019-07-10

人已经看过了!

更新时间:2018-04-09

人已经看过了!

推荐精品模板更多
标签[field:picname/]和[field:litpic/]区别
更新时间:2018-04-14

人已经看过了!

响应式智能工业设备设计类企业w88(自适应手机端)
更新时间:2017-07-26

人已经看过了!

dedecms在线演示插件下载
更新时间:2018-04-24

人已经看过了!

出国留学教育培训机构类w88(带手机端)
更新时间:2017-11-01

人已经看过了!

高端大气装修装饰公司营销官网(带手机端带筛选)
更新时间:2019-11-08

人已经看过了!

世界未解之谜奇闻新闻(带手机端)
更新时间:2020-04-30

人已经看过了!

磨矿球磨机类机械设备源码 重工机械类网站w88(带手机版同步数据)
更新时间:2019-09-06

人已经看过了!