新年的第二天,马超同学在查看收录量的时候忽然发现一个现象,就是貌似百度又清理数据库了,甚至有些词汇的索引数量从几千万减少到了几百万。当然,查看的时候也发现了自己网站被清理出去一些收录,不过大部分还是保存了下来。那么就说说如何让自己网站页面不在清理的时候被删除的方法吧。
其实一直在研究搜索引擎的人都会发现,今年年初元旦那会儿开始到现在,已经有很多的页面被清理过了。以前是千万级别的词汇,现在许多都降到了百万级别。这也正常,作为一个搜索引擎,不可能让自己的数据库无限制的增大,那样会越来越拖慢速度。而且毕竟也有容量大小一说,不可能一直抓取收录。但是对于站长而言,自己网站辛辛苦苦建立起来的内容要是丢失了,就得不偿失了。我从我这个网站被删掉的和剩下的这些页面中,总结出来几个因素,和大家分享一下。第一个就是入口多的页面留下来的可能性大,因为我的网站总结了不少魔兽的知识,而排名和收录最为稳固的,恰巧就是那几个页面,蜘蛛抓取的机会多了,就不会成为死页面,自然没问题。第二个就是页面时常更新,没错,这个是相当重要的一面。不少网站的内页在增加了文章之后,基本上就不会再有新内容了,这也就导致搜索引擎长期抓取到的都是相同的内容。虽然我们可能在侧栏或者其他部分添加随机链接,但是蜘蛛在对页面去除噪声之后,只对页面主题内容进行比对,所以想蒙混过关也是没什么意义的,反而容易出问题。对于站长而言,那些旧页面也是有更新的必要的,如果不更新就会想新闻一样,渐渐的从数据库中清除掉了。
上面这两天内容,就是从中总结出来的相似点。作为小站长而言,把网站做好并且有足够的人看是个很难的事情,不过相对来说,这些也有着自己的心血。所以对于自己的资料性质的文章,一定要时常更新,这是最重要也最方便让人们看到的方法了。
评论列表
尊敬的访客,谢谢您的来访并请您留下珍贵的评论,作为我改进的发展的方向,谢谢!