百度SITE“网页数是估算值”的秘密

作为站长,每天起床的第一件事通常就是site网站,查看百度和Google的收录情况。百度今年早些时候对于网站site结果做了一点调整,新增了一条醒目的提示:“找到的相关网页数是估算值,不代表真实结果数,仅供参考。”很多人都在热烈讨论这个提示的真实含义,至今没有定论。最近,我在查看百度对自己的独立博客收录情况的时候,对这个提示发现了一些端倪。

通常,百度对我的博客收录基本上算比较正常,一般快照都是隔天,新增加的文章都会在第二天完整收录,有时候当天也被收录。但是有时候发现自己更新的文章第二天没有被收录,传说中的星期三和星期四也没有更新,表面上看起来貌似百度遗弃了这些文章。这种情况让人百思不得其解,因为一则自己的文章都是原创的,二则我的独立博客更新一般也是比较有规律的,也没有进行过改版(传说网站改版会影响SEO),为什么没有收录呢?后来有一次,我写的关于赵本山的一个时评文章百度也没有收录,因为文章措辞比较激烈,且涉及到一个具体的车牌号,所以第二天发现百度和Google都没有收录的时候就把文章改头换面了,删除了所有的敏感词,对文章的措辞也进行了修正,基本上算是一个新文章,重新发布。过了几天,忽然发现统计中来了很多那个车牌号的搜索,我在百度上搜索那个车牌号,居然排在第一位的就是我早先发布没有被百度收录的文章,且是修改前的快照。再到Google一搜索,居然自己的那个文章索引也出来了,至此,我对于百度“不代表真实结果数”的提示恍然大悟:涉及敏感信息和个人隐私的文章一般不会出现在site语法中,但是百度其实已经收录了。

百度的这个秘密,也可以看出是非常符合国情的。很多人讨论为什么Google斗不过百度,原因就是Google的中国化不彻底,说白了,谷歌不了解中国的国情。这当然是一个企业文化的范畴,也与东西方文明浸润的深厚文化积淀有关系。百度的这个提示对于站长来说,可谓用心良苦,由此也使得我们对百度肃然起敬。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注