随着对计算机的使用时间越来越长,我对于信息的种种理解也在不断变化着。
开始的时候我受版权的思想很深刻,也把一切都想象的很美好,坚定的认为所有信息都应该有且仅有一份,我们的网络通过超链接把所有的信息给串联起来,我们可以在任何地方、任何时间找到我们想要的任何信息。在这种思想的影响下,我认为一切“转载”之类的活动都是邪恶的,这种冗余浪费资源,也浪费我们搜索信息的效率,因此发生了这篇文章中记录的事。后来我不再那么激进了,但我依然不认为网上有了重复的内容是一件好事。管不了别人,我自己都是尽量按照这种要求来做的。
不过最近我开始改变这种想法了。
起因是因为我发现一些网页已经消失了。本来我想的是这些信息随时都可以从网上找到,因此我一般就在 Del.icio.us 里加一个链接就可以了。我从 2005 年开始使用 Del.icio.us,总共记录了将近 500 个链接。最早我没有自己固定使用的电脑,因此随时可以访问的 Del.icio.us 就特别吸引我,后来有段时间我干脆把它与我的浏览器的收藏夹给结合了。虽然 500 个链接对于别人来说不过是沧海一粟,但我一直重用着 Del.icio.us,把自己认为重要的链接都交给它去保管。在这几年中也有别的网络书签服务,比方说 Mister Wong 和 Google Bookmarks,但我一直特别信赖 Del.icio.us,一直没有切换。结果 Del.icio.us 几经易手,最后还是稳定的坚持了下来。
不过 Del.icio.us 稳定,不代表里面的链接稳定。在 2005 年那阵子,blog 对我来说,还是一个非常新鲜的词汇,我也不看好 blog 这种服务,但 blog 确实是在国内蓬勃的发展着。那时候我自己不看好 blog 这个东西,因此自己没有使用,仅仅是一个观察者,对于任何 BSP 的服务我都没有尝试过。不过那时候有很多人就已经开始玩 blog 了,而且很多有经济能力的人不仅仅满足于使用免费的 BSP 提供的服务,而是开始自己买共享空间假设 WordPress 等程序。虽然很多人是合租的空间,但我在 2005 年至 2008 年之间看到过很多这样类似的 blog 网站,我也看到了很多给我印象深刻的文章。
后来我渐渐的会发现有些网站无法访问了,因为作者没有给自己的空间续费,因此服务器就给停了,点进域名后看到的也只是卖域名的网站的广告,看来那些人们放弃维护 blog 后连自己的域名也不要了。一开始发现这种问题的多数是一些无关紧要的 blog,我没有特别在意。不过前几天我心血来潮,整理了一下我的书签,发现有相当多的网站都关闭了,其中不乏一些技术 blog。也有一些网站虽然未必有很多技术内容,但里面有一些我喜欢读的文章,也都统统不见了,让我觉得非常遗憾。
大上个星期我一直比较关注啄木鸟社区这个 wiki,以及它的元老之一 Zoom Quiet。我从这个 wiki 上看到了一些 Zoom Quiet 的演讲,其中的一个《我的工具箱》的演讲中他提到了他用 ScrapBook 在几年中离线保存的很多网页,并把它们统一导出,组织在一起,共享在了他的主机上。
我之前听说过 ScrapBook 和 Zotero 这些 Firefox 插件,但一直认为它们对我来说没什么用,结果这次看了 Zoom Quiet 整理的这些页面后才让我感觉非常震撼。Zoom Quiet 在演讲录音中得意的说在他用 ScrapyBook 来静态保存有价值的网页的这几年中,发生很多次他保存过的网页失效的情况,结果因为他把这些网页都保存了下来,他从来不怕这些网页失效。我听了不由的想,如果我几年前开始保存的不是网页的链接,而是网页本身,会不会就不会发生我今天这种保留了网址而网页却失效的尴尬事了。
过去我还用过 Evernote,但我只用它来保存过我不经常去的网站的内容。其实 Evernote 也可以很好的完成这种人物,但我过去一直没有强烈“网页”有可能会消失的意识,因此也一直没有关注这些东西。
在一些网站建站工具中,我特别喜欢 wiki 这种东西,原因之一就是因为它有版本控制的功能,可以保障我们在上面发布过的内容永远都不会消失。我曾经多次考虑过用 wiki 工具来管理我的网站,虽然由于种种原因一直没有实现,但我仍然喜欢在自己的主机上放上一个 wiki。我曾经幻想过,如果我们的互联网有一天有了版本控制功能,那么我们会不会方便许多。不过虽然愿望是美好的,但实现起来还要好几个技术阶段。看一看 MediaWiki 的历史就会理解要弄一个百科全书规模的网站会给服务器带来多么大的压力。
我曾经也盲目崇拜过一些大公司,认为它们永远都不会倒闭,把数据放在它们那里是非常可靠的。随着时间的发展,我渐渐的也改变了这种想法。“永恒”是人们的希望,但没有可以绝对永恒的东西。Google Wave 刚出来的时候我非常激动,结果一年左右它就被关闭了。我不知道哪一天也许 Google 就关门了。过去我认为这不可能,但现在我不 100% 期待了。虽然也许有点极端,但为了保证数据的安全性,我不觉得这样考虑非常过分。正好我今天看到一个运行在 Google App Engine 平台上的图片管理程序 FotoRatan,在它的 plans 页面 里列出的付费方案的时间限制写的是“till google die”。我过去会认为这表示这个服务是永久有效的,而现在我确定它的期限是 Google 关闭的那一天。
今天,我的数据很多都在各大网站上。比方说我的私人电子邮件都在 Gmail 里、照片都在 Flickr 里。我过去认为这样很可靠,不过后来我有点后悔。因为这样就表示我把一切都押在这些公司的生存上了,一旦它们倒闭,我的资料也许就全丢失了。因此当我有了自己的域名之后,我开通了 Google Apps 服务。最开始时时因为我觉得有个以自己域名为后缀的邮箱很酷,现在我觉得这样的好处是一旦 Gmail 坏掉了,我的邮箱地址还是有效的。自从我开始用 VPS 之后,我学会了把 Gmail 中的邮件备份到自己的服务器上,我还考虑过时不时自己运行个邮件服务器给自己用…… 直到我意识到这是一种强迫症为止。
Flickr 也是一样。我在很久之前分析过几个提供照片存储服务的网站,最后选择了 Flickr,并且用了 4 年的付费 pro 帐号。不过我不是那种喜欢没事拿个相机乱照的人,目前从设备上来说把照片从相机弄到电脑里也挺麻烦,因此我上传的照片都不多,加上 Flickr 在国内访问的问题,我在今年就没有继续付费,而是开始把照片放在自己的服务器上用 Gallery 程序来管理,这点我没有什么经验,正在实验中。
当然,个人在网络上的数据最多还是 blog。像微博那样的东西还没有成熟到我可以把它当作保存数据的东西,因此不予考虑。从 2005 年到现在,我发现有些商业的 BSP 都已经关门了,何况私人主机上的 blog。更多的情况是网站存在,但一年多都没有一点新内容发表了。到今天我自己决定要把自己的 blog 继续维护下去,但我实在是不能确定别人也会一样这样做,这实在是一个令人沮丧的问题。不过如何能重新调动起人们对自媒体的输出欲望,也许这是一个新的商机?
总之,对于网页,我希望它们不朽,但很多情况下事与愿违。如何更好的保存信息,让它们保持有效、保持有效率,互联网的演化仍然需要继续。
所以我现在的blog和wiki都是用Jekyll+Dropbox+GitHub搭建的,基本是万无一失了。
数据同步哇。VPS要常备份,以防不测,弄个脚本让自动进行。然后控制下带宽,以防访问不良。
VPS 确实有备份的问题,不过我这篇文章主要说的是别人的网页。毕竟自己的网页就算丢失了也是自己的责任,最多打自己两巴掌算了。而当你点进收藏夹里的一个链接后,却发现人家的网站早就关了,那才叫一个郁闷,一腔邪火简直没地方发泄 👿
web保存之……格式自己定 本机一份,还要扔dropbox目录里。 然后怕dropbox倒闭的同一天正好电脑崩了,放移动硬盘或者NAS或者VPS一份。 最后压缩下,改个名,高数玛利亚步兵片.rar,扔电骡网络里……除了2012之类的情况,这些东西永远不会再丢了。
You need VPS, docker, and wallabag!
就是Docker反向代理这部分我还没完全弄明白。docker-compose我可以正常运行实例,但Nginx配置反向代理就MoinMoin成功过一次,其他的以失败居多。我前几天还想把我服务器上所有跑的服务都Docker化,也是以失败告终。
看到你的博客上有一些你写的Docker学习资料,准备找时间再学习一波,最终以全部服务Docker化为目标。:)