Baidu

愚民政策的胜利

前几天,中文互联网圈子里充斥着一条新闻——百度血友病贴吧被卖。开始时我有点好奇,贴吧被卖是什么意思?“贴吧”怎么能被卖掉呢?看了一下新闻,我才知道,所谓被卖,原来是百度把血友病贴吧的管理权出售给了一家付费的机构或个人。我只是看到了单方面的说辞,因此不确定事实的真相如何,不过假设新闻属实,我也觉得有些不以为然。

Google 搜索结果中的 Baidu result

今天去 Google 搜索“VeryCD 改版”时,突然发现了一点有趣的地方。截图如下:

google-baidu-result.png

我用红线标出来的地方就是我要说的。不知道是不是我的搜索关键字搜索出来的结果包含了很多中文,还是因为 Google 自己索引了很多 baidu.com 的网页,所以出来了这么一部分。

昨天偶尔遇到的事情

已经想不起昨天我是怎么看到这篇文章了。作者孔令春对我在2007年对他做出的评价发出了疑问。我曾在2007年7月20日左右在Twitter上说了一句“孔令春学习网,纯粹一个抄袭网站。虽然聚合了一些好文章,但确相当可鄙。”,当时我的blog上装了twitter-post这个插件,自动把当天的twitter条目整理成一篇文章,发布在blog上。然后2007年11月份,孔令春在他的百度空间上的文章如下:

维护这个博客也有一段时间了,每次的评论朋友们都说不错,很有帮助!所以才得以支持到现在.

可是今天在百度搜索时无意中看见一位朋友的评价,感触很多!不错,评心而论,这的确称得上是一个纯粹的抄袭网站,因为本站的80%的文章都是转载,我也曾经一再声明过,本站文章不全是自创,有的因原创作者没有要求,有的是因为根本不知道作者是谁,所以大多数并没有标明。

Google 和百度对我的 blog 收录的观察

最近在新的blog系统上花了些心思,并在搜索引擎收录的方面有了一点心得,记录如下。

1 百度懂得找新页面

我过去用WordPress的时候,单篇文章的URL用的是/年/月/slug/的格式。而现在用的Movable Type所产生的静态页面的URL却是/年/月/slug.html格式的。这样一来在搜索引擎里的单篇文章地址就有许多过去留下的错误链接,这些链接都无法访问。在Google里面,挺奇怪的是我过去的那些文章都排在了前面。大约前3页以内没有.html结尾的页面。我不知道是不是那些地址资历“老”的原因。而在百度里,我新发布的页面都排在前面,刚才又查了一下,似乎旧格式的页面都不在搜索结果里面了。