成功的一面
今天下午研究了一個台灣的blog小團體“憂鬱馬戲團”的歷史。這個團體成立與2003年,是幾個人一起的松散小組織。有一位負責技術的人用Movable Type在個人主機上搭建blog程序,團員們集資支持,然後就可以不用管底層的技術,專心寫blog了。這種運作模式有點像TypePad。
今天下午研究了一個台灣的blog小團體“憂鬱馬戲團”的歷史。這個團體成立與2003年,是幾個人一起的松散小組織。有一位負責技術的人用Movable Type在個人主機上搭建blog程序,團員們集資支持,然後就可以不用管底層的技術,專心寫blog了。這種運作模式有點像TypePad。
我在2007年3月份开始在独立空间上写blog前,曾经在几个BSP上写过blog。过程分别是Blog.com.cn -> Blogger -> Blogsome -> Blogger(beta)。
最早在blog.com.cn上写了几篇后,发觉Blogger更优秀一些(现在时间长了,我对blog.com.cn都没有了什么印象,它好像不是WordPress搭建的),于是就从Blogger上开写。
上一篇文章里说,我目前的blog在Google索引里总是旧的链接排在前面,而新的排在后面。新的链接和旧的相比几乎没有变化,两者间唯一的不同在于旧链接的结尾是/,而新链接是以.html结尾的。把/换成.html就可以访问到新的页面,否则就会得到404错误。我是没有问题,但不知情的人从Google里搜索到我的页面,获得404错误就不大方便了。
因此我在上一篇文章里写过,我在想法子让Google把顺序调整过来。我当时的主意是先在robots.txt里面加上“Disallow: /”这一句,粗暴的阻止任何搜索引擎索引我的全部页面。等Google搜索结果里面不含我的站点的任何结果后,再去掉robots.txt里面的那一句,让Google重新索引。相当粗暴的办法,我也不知道有没有效。但写文章的时候我自己提到了Sitemap,我才想起可能我的问题可以用sitemap来解决。
最近在新的blog系统上花了些心思,并在搜索引擎收录的方面有了一点心得,记录如下。
我过去用WordPress的时候,单篇文章的URL用的是/年/月/slug/的格式。而现在用的Movable Type所产生的静态页面的URL却是/年/月/slug.html格式的。这样一来在搜索引擎里的单篇文章地址就有许多过去留下的错误链接,这些链接都无法访问。在Google里面,挺奇怪的是我过去的那些文章都排在了前面。大约前3页以内没有.html结尾的页面。我不知道是不是那些地址资历“老”的原因。而在百度里,我新发布的页面都排在前面,刚才又查了一下,似乎旧格式的页面都不在搜索结果里面了。
最近用着Movable Type的感觉还不错,但有一点是我特别不习惯的:就是页面预览。
我不喜欢用所见即所得的编辑器,一是因为用起来很麻烦,远不如Markdown来的直接方便;二是在一个在线的网页里用这种所见即所得编辑器的速度也实在是慢;三是不兼容,因为编辑的时候编辑器要parse页面的HTML代码,不同编辑器的parser不同,因此用Frontpage编辑的页面,再用Dreamweaver来编辑就不是很容易。
今天弄好了blog的CSS后,在回家的路上想到:既然header的背景是用一张照片的顶端,那为什么不把那张照片的底部截取出来当作style的footer呢?于是回家后就弄了一下。不过由于我在处理header的时候颜色参数是胡乱调的,因此footer的参数我也是胡乱弄的。两者可能不是很统一,不过应该没有太大影响。
随着对Movable Type的theme的了解的加深,我发现一个theme其实是很简单的。无非在一个目录下包括了screen.css和需要的资源图像,以及thumbnail.gif和thumbnail-large.gif文件用于后台系统的style切换的style缩略图。我照着相同的规格,把我自己的东西都放到了另外一个目录下,并做了截图,果然Movable Type的后台出现了我做的style。不过style的名字却显式未命名。我看了一下其它style,原来在screen.css这个文件的开头有注释来表明这个style的名字、作者资料等等。我把我的资料加上了后就一切OK了。
我从来都不是一个网页页面设计的爱好者。原因大概是我足够懒,对于像页面设计这种精细的工作很不擅长,而且我对美工没有天分,从小美术课上鉴赏还行,自己动手画就不行了。或许是这个原因同时也导致我对网页的关注的重点一直在内容上。可能是性格使然,我特别痛恨那种”过度设计”的页面。一方面过于花哨的页面元素降低了页面的载入速度(我发现即使我们从电话拨号上网的5K/s下传速度进步到500K/s的宽带下传速度,仍然有人在制作更花哨的页面),另一方面太花哨的页面也确实不美观,反而显得内容不正式,适得其反。
嫌在浏览器里用海词太麻烦,写了个Perl脚本来提取单词的解释。使用时把单词通过参数送进去就OK了。支持词组。查无此字时理论上不会有输出。
没有使用任何“高级”技术。通过LWP模块把网页弄下来,找到解释所在的位置,通过正则表达式提取出来就差不多了。本来想连例句一起弄出来,但只能做到一条例句的情况,如果例句多了只能显式第一条。如何完美的显式所有例句,还需要再想办法。