如果去除采集内容里的链接和广告
如果过滤内容里的链接呢?这里可以在 过滤选项 的 替换:(针对标题与内容) 里输入正则,多个用逗号分开,但是不要在这里写<a[!--ad--]>,</a>,<A[!--ad--]>,</A>,这样的正则,因为这样你会采不到页面,呵呵,它把你采集的页面都给过滤了。
过滤广告最简单的方式是在“过滤广告正则”的输入框里输入相应的正则,4.7以前的没有带,4.7以后的系统带的有,下面是个比较全些的广告过滤正则:
<a[!--ad--]>,</a>,<A[!--ad--]>,</A>,<div[!--ad--]>,</div>,<DIV[!--ad--]>,</DIV>,<iframe[!--ad--]</iframe>,<IFRAME[!--ad--]</IFRAME>
基本上已经够了。
一般我们采集规则写好后,比较郁闷的就是内容里的链接了,因为我不想看到内容里有别人网站的链接,当然更不用说广告了。这里需要说明的是,下面的方式只可以替换掉一些规则或者相对规则的链接和广告,只要那些比较变态的网站在内容里加很多随机文字的,那就没办法了。
相关热词: 链接
本站内容来源于网络,如有侵权请与我们联系,我们会及时删除,我们深感抱歉!
注:本站所有信息仅供用于网络技术学习参考,学习中请遵循相关法律法规!
本文地址: https://www.juheyunku.com/jz/ecms/3673.shtml
相关文章
热门TAG
命令 权重 外链 企业网站 白帽 php 织梦教程 dedecms修改内容 javascript 织梦 功能 标签 调用 详解 服务器 网站流量 实例解析 Dedecms 织梦cms HTML tags标签 python jquery教程 jquery windows SEO优化 蜘蛛 搜索引擎 网站收录 JSP最新文章
-
帝国ecms列表页标题图片判
时间:2020-12-26
-
帝国cms模板怎么在BGK和U
时间:2020-12-25
-
帝国cms会员前台怎么关闭
时间:2020-12-25
-
帝国CMS7.0碎片功能升级后
时间:2020-12-25
-
帝国cms怎么修改软件下载
时间:2020-12-25
-
帝国CMS 6.0功能解密之会员
时间:2020-12-15
-
帝国cms如何导出模板
时间:2020-12-14
-
帝国CMS 6.0功能解密之评论
时间:2020-12-13
热门文章
-
帝国CMS7.0新增将信息处理结果反馈给会员
时间:2020-12-10
-
帝国CMS7.0专题大更新,功能更强大,制作
时间:2020-12-10
-
修改帝国CMS模板出现Application Firewall Ale
时间:2020-12-08
-
帝国CMS7.0新增外部登录接口平台,且将率
时间:2020-12-10
-
帝国6.6版本新增信息快速修改基本属性功
时间:2020-12-11
-
帝国CMS7.2新增批量更新信息评论数功能,
时间:2020-12-09
-
帝国cms6.6版本新增专题属性自定义字段功
时间:2020-12-12
-
帝国CMS7.5的信息头条和推荐各支持255级更
时间:2020-12-08
-
帝国cms的信息反馈增加反馈编号加回复功
时间:2020-12-12
-
帝国CMS用户自定义函数取昨天发表的文章
时间:2020-12-09
