Firefox3书签中的Tags存哪儿了?

电脑岁数大了是不行,即使装上了号称速度有很大改观的Firefox3,我的老爷机也没快到哪儿去,这还是在一大票插件都由于不兼容被咔嚓了之后,唉。

不过Firefox3还是有些不错的新功能的,比如网址栏中的“星星”,和Gmail里面的哪个很像吧,不知道是谁家的专利,这个星星挺有意思,当你浏览到觉得不错的网站时,点一下星星就可以收藏起来了,默认是在书签的Unfiled Bookmarks文件夹中,以后可以慢慢整理;点两下星星会弹出窗口让你选保存位置,并可以输Tag。

Tag可以说是Web 2.0的标志性特征了,也是组织和查找信息的一种有效方式,所以我就很感兴趣,这个Tags被Firefox3存到哪个文件里去了?Tag的存储方式和Tag Cloud的算法我很感兴趣,也想看看FF的解决方式。

一般Firefox会把书签保存在bookmarks.html文件当中,不过Firefox3改进了,把书签放到了sqlite数据库中,文件名就叫做places.sqlite。这个文件在Firefox3运行时会以独占方式打开,关闭FF后才能用sqlite3打开。

起初没想到有什么难处,直接看schema,结果仔细的读了一遍也没发现哪些地方有tag的踪影:

  • moz_anno_attributes 注释的属性,没几行数据,不知道干啥的
  • moz_annos 目前是空的,应该是什么的注释
  • moz_bookmarks 书签项目
  • moz_bookmarks_roots 书签项目的根网站集合,新安装FF的还没数据呢
  • moz_favicons 网站图标favicon的位置
  • moz_historyvisits 哪个网站你浏览了多少次,偶的隐私啊。。。
  • moz_inputhistory 输入历史?暂无数据
  • moz_items_annos 书签的注释,也就是那个“Description:”
  • moz_keywords 关键字,和“Description:”在一个界面输入,没啥用处
  • moz_places 所有浏览的地址历史

看吧,没哪个表是和tag有什么关联的,可用grep一查,我标记的tag确实是在这个文件中,只好出绝招:

sqlite3 places.sqlite ".dump" > t.sql

然后在t.sql里面一查找,终于明白了:

INSERT INTO "moz_bookmarks" VALUES(346,2,NULL,4,2,'testtag',NULL,'',1208788891265751,1208788891362043);
INSERT INTO "moz_bookmarks" VALUES(347,1,638,346,0,NULL,NULL,NULL,1208788891361294,NULL);

tag就是存在了moz_bookmarks这个表中,和书签的记录混在一起。像上面这种情况,每个tag除了自身占一行记录之外,如果有几个书签被标记了这个tag,那么就还会多出几条记录tag-书签关联关系的记录。

窃以为这并不是存储tag的最佳方式,而且FF在tag的使用上也太简单了,目前看到的就是一个Smart Bookmarks里能按常用tag查网站,连Tag Cloud也没有。一是不知道以后的tag数据格式是否会改变,二是应该会有扩展来完善这块功能,期待吧。

ADOdb的数据字典功能及其它

在新项目中继续使用ADOdb,这个是没什么悬念的了,尝试过php5自带的pdo,感觉一般,对某些数据库的支持更一般。但是数据库结构如何维护这块放不下心,从以往的开发中看,系统开发维护期超过半年之后,如果在数据库schema管理上不下点功夫,在生产服务器和多个测试服务器以及sql结构之间,难免会产生schema不一致的情况,管理情况再差的,连最后一稿schema是哪个、以及schema注释都能丢失。所以,无意中瞥到ADOdb还有一个ADOdb Data Dictionary Library for PHP以后,就想看看这个能否用在多环境数据库schema同步方面,连同自己了解的一些其它情况,记录在这里。

ADOdb Data Dictionary Library for PHP

可以用简单的字符串或者数组的方式记录数据表的结构,然后调用相关功能来生成修改数据库的sql语句,并执行之。应该是在创建数据表方面还是非常方便的,虽然数据类型简单了一些,执行和调用也略显麻烦(抱歉我的确是这么认为的),但在简单的应用中,尤其是数据表修改不是很多的情况下,应该会很好用。

ADOdb XML Schema (AXMLS)

这个其实也是包含在ADOdb中的,其介绍也是直接列在了ADOdb Data Dictionary Library for PHP同一页的下方。在仔细把这段并不多的内容读完之后,我是半喜半忧,喜的是AXMLS这个东西可真好啊,相当于能够把整个数据库的schema xml化了,然后对实体数据库进行更新;忧的方面一是,在最新的ADOdb5.04当中,依然没有完全实现AXMLS中的全部功能,我建了一个简单的xml,其中带有一句:

<opt platform="mysql">TYPE=INNODB</opt>

然后在一个空的数据库上执行,输出sql,发现CREATE TABLE的sql中并没有带上ENGINE=InnoDB,所以就停止了尝试;忧的方面二是这么好的东西,它的官方网站上最新的消息却是2004年6月17号的,一个软件不可能在4年中一点都没有改动,况且那时候还没有php5呢吧。在互联网其它方面来搜索这个AXMLS,发现只是在adodb中有,并没有在其它项目中得到运用,可惜了了。

一些商业软件的实现

很多商业软件的数据库schema管理一般都在case工具中,也有生成sql甚至直接对数据库应用schema变更的功能,比如我以前使用的PowerDesigner,不仅是最好的数据库实体模型设计工具,而且设计完成后,直接连上数据库进行更新。也可以反过来,从实体数据库中分析出数据库模型。

东西是好东西,可用了一段时间不再想用下去了,原因是多方面的,一是Sybase的东西bug总是很多,有时候莫名其妙的错误提示很头疼,二是数据库大了以后,每次连线diff的时候都很慢,最要命的是,它在更改column时喜欢用临时表,然后删除原表建新表,再从临时表中把数据读回来,一旦这个过程由于数据库兼容问题或者其它原因被中断,下次再同步的时候,很有可能数据库结构更新了,而数据却丢失了,因为它有自动删除临时表的选项,并且一般大家还都需要打开这个选项;最后一个原因,这玩意儿既没有Linux版本,我也没有正版的授权,所以能下岗就下岗了。

自己用简单的脚本来实现

其实在实际的应用开发中,数据库相关要修改的地方会很多,不仅有表、索引、视图等数据库本身的元素,还可能会有一些数据的调整和处理,比如将表中的A、B字段去掉,他们的值相加存储在一个新的C字段中,如果说前者应该会有成型的工具能够实现的话,像后面所说的这种数据库,或者更准确一点说是数据调整在任何工具中都不会涉及到的。

反过来想,无论是对数据库如何进行操作,无外乎就是DDL数据库定义语言和DML数据库管理语言,也就是通过大家常说的SQL语句来操作,那么把这些简化为一个SQL语句集合,就可以将开发过程中所有的数据库变动转化为这一系列SQL语句的管理和执行,设计这样一个工具不就得了么?

我现在就是这么作的,在svn中除了有保存数据库最终状态的schema sql文件之外,还专门有一个php文件,用数组记录每一次需要对数据库调整的SQL,然后有一个执行记录表,记录哪些SQL执行过而哪些没有。这个执行记录表在每个数据库实例中都会创建,这样,我只需要简单的调整数据库连接参数,然后就可以通过执行php代码,依次逐个的执行每个SQL了。

有一个缺点,就是SQL语法太依赖具体的数据库类型了,没办法,好在更换数据库的情形并不多,平时尽量写标准的语法吧。另外真要转换数据库的时候,还可以另起炉灶嘛。

其它的开源软件都是怎么实现的呢?

我阅读过的开源软件源码并不多,但软件还是用了一些,在有些软件升级的时候,就会自动将数据库也升级了,他们都是怎么实现的呢?难道说只是在1.0升级到2.0的升级程序upgrade.php中,固定的、一次性执行数据库修改么?

关于同类数据备份和迁移

以前一个朋友用oracle数据库的时候,特别喜欢用tora(他管它叫蛤蟆,因为软件的about页上有只蛤蟆),但我却认为,在同类数据库,尤其是版本、配置相同的数据库之间进行数据转移,方便一点的方法是利用数据库的导出、导入功能,这样不会有DML覆盖范围以外的内容拉下,简单一点的,自己写个小程序,连上两个数据库,这边读来那边写,也不会慢到哪里去,想提前删个索引什么的也好控制。tora一类的工具,应该是在灌初始字典库的时候用最合适。另外,不是还有bcp么?

参考