网站运营 
首页 > 网站运营 > 浏览文章

有什么好方法防止自己网页的内容被采集

(编辑:jimmy 日期: 2024/11/7 浏览:3 次 )
防采集第一种方法:在文章的头尾加上随机广告

网站采集者在采集时,通常都是指定头尾特征从哪到哪过滤.我们这里讲的第一种方法:文章头尾加随机广告,当然随机广告是不固定的。
比如你的文章内容是"校内网涂鸦代码",则随机广告的加入方法:
<div id="xxx">随机广告1欢迎访问校内网涂鸦代码站随机广告2</div>
注:随机广告1和随机广告2每篇文章只要随机显示一个就可以了.

防采集第二种方法:在文章正文页面插入重复特征头尾代码的注释。文章列表加随机不同的链接标签,比如<a href="",<a class="dds" href=''

当然,这个可以用正则去掉,但足于对付通用的CMS采集系统了。。
<!--<div id="xxx_文章ID">-->
其它标题或内容...
<!--<div id="xxx_文章ID">--> <div id="xxx_文章ID">
随机广告1欢迎访问4399com小游戏站随机广告2
<--</div>--></div><--</div>-->

防采集第三种方法:加在文章列表的随便链接样式。
即:正文头尾或列表头尾添加<!--重复特征代码-->
原理是让采集的人无法抓到列表链接规律,无法批量进行采集.

请看:
<a href="xxx.html">标题一</a>
<a alt="xxx" href="xxx.html">标题二</a>
<a href='xxx.html'>标题三</a>
<a href=xxx.html>标题四</a>

  如果你把三种方法全部加上,我想一定能让想采集的人头疼半天而放弃的..
  如果你还问,如何防止别人复制采集呢?要做到这一点容易,把你的网站的网线拔了,自己给自己看就好了.

上一篇:草根建站满月经验谈
下一篇:为什么我做了这么多的网站都没赚到钱
一句话新闻
高通与谷歌联手!首款骁龙PC优化Chrome浏览器发布
高通和谷歌日前宣布,推出首次面向搭载骁龙的Windows PC的优化版Chrome浏览器。
在对骁龙X Elite参考设计的初步测试中,全新的Chrome浏览器在Speedometer 2.1基准测试中实现了显著的性能提升。
预计在2024年年中之前,搭载骁龙X Elite计算平台的PC将面世。该浏览器的提前问世,有助于骁龙PC问世就获得满血表现。
谷歌高级副总裁Hiroshi Lockheimer表示,此次与高通的合作将有助于确保Chrome用户在当前ARM兼容的PC上获得最佳的浏览体验。