从9个方面入手,去除网站内的复制内容

 2021-02-26 16:19:41  535 浏览  0 评论   赞

第一、网址规范化;第二、复制产品;第三、打印页面;第四、RSS订阅;第五、Session原因;第六、内容过少;第七、采集伪原创;第八、网站镜像

从9个方面入手,去除网站内的复制内容

图5482-1:

重复内容是SEO中很常听到的一个词,这些内容有时候是为了方便用户浏览而设定的功能,而有些则是系统的因素造成的,如果网站中出现了大量的复制内容,很容易给搜索引擎判断出并给予处罚,今天和大家总结到底什么原因导致这些复制内容的出现。

有些复制内容是我们能发现的,但有些我们可能没有注意到,但这些内容却实实在在的对网页的权重以及关键词排名产生影响,本文就根据自己的经验总结这些原因,希望看了本文能让大家明白以后应该注意哪些地方,分别从九个方面来进行说明。

第一、网址规范化:如果网址不规范,则很可能会出现重复内容,这些重复内容我们自己感觉不到,比如最常见的就是网站的首页有多个版本都可以访问,显示的结果都是首页,但对搜索引擎而言,这些URL是不同的,会被定义为重复内容。因此解决的最好办法就是用301对网页进行重定向。

第二、复制产品:如果是电子商务类的B2C站点,有些产品会有代理商,因此我们的网页会被代理商原封不动的复制过去,这就造成了很多一摸一样的页面,虽然我们允许代理商这么做,但从SEO的角度来看,这并不是一个好现象。我们可以引导代理,让他们网页加上合适的内容,以和自己的网页做区分。

第三、打印页面:打印页面是很多网站都会提供的一项基本功能,尤其是政府企业类的站点,但如果没有使用robots.txt禁止抓取这些页面的话,就会形成很多重复内容和页面。站在SEO的角度,应该禁止抓取这些页面。

第四、RSS订阅:很多网站尤其是博客类或新闻类的网站,都会使用其他网站的RSS种子来自动生成网站的内容,其实这些内容已经在原始地和很多别的网站上出现了。这相当于直接进行了复制,也会造成重复内容。最好的解决方法是不要使用别人的RSS种子。

第五、Session原因:有些网站在访问时候会定义一个Session ID,以区别不同的访问者,但是当搜索引擎的蜘蛛在不同的时间访问网站时,就会形成不同的ID,因为它的参数不同,但是这些ID最终的页面是同一个,这就造成了不同的URL对应相同的内容,也是造成重复内容出现了一大原因。因此我们可以通过IP来进行判断,如果是蜘蛛IP,那么就不要产生Session ID。

第六、内容过少:网页都会有很多公用的部分,比如导航和版权,以及产品分类等,除此之外就是正文内容,我们判断网页之间的区别依靠的就是网页的内容,但如果网页中正文内容过少,占网页中总体比例过小,那么搜索引擎很可能认为这些页面是重复页面。唯一的办法就是增加内容,比如从功能上、用途上、用户评论上下功夫。

第七、采集伪原创:大家做站需要更新,很多站长都会去采集别的网站来填充自己的内容,有时也有可能是会员在不同的网站发布同一篇文章,所以这些因素都会被当做是重复内容。这些内容也有可能被收录,但是过一段时间有可能被删除掉。这个大家都知道如何做。

第八、网站镜像:网站镜像会常用在较大型的网站上,尤其是下载站,需要不同的服务器进行均衡负载,方便了不同地区的用户浏览和下载资源,但是一个比较大的危害就是产生重复内容,时常听到镜像站被搜索引擎惩罚的例子。所以可以采用JS调用的方法或者是禁止抓取。

第九、排序方式:排序方式尤其在电子商务站点比较常见,比如网站的产品能按照销量、价格、上架时间、好评度进行排列,但是不同的排列方式可能结果高度相似,只是很小的差别,这也能造成一定的重复内容。最好的解决途径就是采用noindex,nofollow进行整站屏蔽。

好了,本文就到这里吧,以后会继续和大家分享其它相关的知识,欢迎大家和我交流,本文来自深圳网站建设,网址:http://www.zijiren.net/,转载请保留版权,谢谢!

 

转载请注明:网创网 www.netcyw.cn/b5482.html

()
发表评论
  • 昵称
  • 网址
(0) 个小伙伴发表了自己的观点
    暂无评论

Copyright © 2018-2022 小王子工作室 版权所有 滇ICP备14007766号-3 邮箱:yangzy187@126.com