什么是数字档案馆,现在尚无定论。无论是学术研究人员,还是项目建设人员,大都处在摸索和实验的阶段。目前在学术界主要有两种观点:一种观点认为数字档案馆是一种实体概念,是全方位实现信息化的新型档案馆,它包括服务数字化和档案馆其他业务职能的信息化。实现了数字化馆藏的存储、维护、传输和提供利用,同时实现了文档接收、征集、整理、著录、鉴定、编研、维护、保管、迁移等各项工作的信息化。第二种观点认为,数字档案馆是一个跨越空间的档案信息资源的集成,主体是基于网络的共享数据库系统,它突破了馆与馆之间的物理界限,将分散在不同物理位置、不同载体上的信息联接起来,向用户提供方便快捷的在线信息服务。①简单来说,基于本馆信息化②的数字档案馆和基于信息共享的数字档案馆将成为数字档案馆的主要形式。而且实践将说明,这两种数字档案馆具有很大的互补性,未来应该看到基于“信息化充分发展的档案馆“的信息共享空间。
在国际档案界,“数字档案馆”(digital archives)概念虽然目前不像“电子文件”那么“火爆”,但却有逐渐升温的可能,而且相关的项目也越来越多。美英两国关于数字档案馆的研究比较集中,而加拿大、澳大利亚、荷兰等国家虽然对美英两国数字档案馆中的某些项目内容也有深入研究,但却相对分散,而且较少使用“数字档案馆”这样的概念。本文将主要以美国和英国的情况为例,对国外数字档案馆建设进行简单的介绍。
一、基于信息共享的数字档案馆
此类项目主要是由图书馆等机构发起而由档案馆参与的项目,其中较为典型的有伊利诺斯数字档案馆。该“数字档案馆”主要是由该州的图书馆和行政部门联合建设和维护,参加者有15个机构,除了伊利诺斯州档案馆之外,还包括两所学校,一个历史研究会和一个博物馆。其项目的主要目的是在网上为用户提供有关该州历史和现状的信息,同时为项目参加机构向伊利诺斯数字档案馆上传数据提供工具。
这样的合作项目还有美国的西北数字档案馆 (northwest digital archives),该数据库于2002年初由13个机构共同建立。该项目得到美国国家人文基金批准,资助金额为两年35万美元。参加该项目的13个机构除了高校和历史协会之外,还包括华盛顿州档案馆、西雅图市档案馆。该数据库最终将安装在华盛顿州立大学,为各类研究人员提供在线的信息检索和服务。
因为在欧美国家数字图书馆的建设中包括档案资源,因此这种由图书馆、档案馆参加的基于信息共享的数字档案馆非常普遍。其核心部分主要是数据库和网站建设。数字档案馆建设的过程中除了遇到数字化技术、数据压缩、数据组织、信息检索等技术问题之外,还会遇到数字化权、著作权、隐私权等法律难题。
由于该类型的项目主建方不是档案机构,也就无形中降低了从专业角度对它进行分析的价值。从目前掌握的材料,似乎还没有由若干档案馆联合建立的基于信息共享的数字档案馆。
二、基于本馆信息化的数字档案馆
这种类型的数字档案馆,根据其现阶段信息化侧重的不同,可分为重视服务数字的项目和强调各项业务活动信息化的项目。前一种基于数据的积累,后一种则基于各种研究成果的积累。此分类并不是数字档案馆类型的划分,而只是强调不同数字档案馆项目切入点的区别,因为这两种思路将会殊途同归,英国的NDAD(National Digital Archive of Datasets)和美国的电子文件档案馆(BRA)分别是这两类的代表。
1、基于服务信息化的数字档案馆
20世纪90年代,英国国家档案馆为了履行安全保管和提供利用电子文件的义务,实施了两项计划,一项是针对政府机构产生的电子文件的EROS(E1ectronic Records Oelce System);另一项就是NDAD。NDAD是为了保存和利用结构数据集(DATASET)而提供的整套系统和服务,由伦敦大学计算机中心和伦敦大学图书馆建设和维护。NDAD的主要功能包括,接受、存储、保管政府部门产生的需要永久保存的数据集(比如每年的农业人口普查、犯罪统计、污染土地面积的报告等),并且提供利用。1998年3月,NDAD作为一项服务向社会推荐。公众可以通过网站访问某些政府部门的一手数据和背景材料。为了提高服务质量,NDAD还提供了随时报道数据变化和发展的在线新闻服务。
NDAD项目主要侧重于数字馆藏的信息服务,虽然它也在网站和系统建设的基础上兼顾了数字档案的保管问题。但该项目对电子文件真实性、完整性、长期可读等问题的研究并不深入,而且该项目中的数据种类相对单一(主要是结构化的数据)。这两个因素都在一定程度上降低了该项目的示范作用。
2、基于整体职能信息化的数字档案馆
其中最具代表性的就是美国国家文件和档案管理局(NARA)组建的电子文件档案馆(ERA,E1ectronic Record Archives)。与NDAD相比,ERA更侧重于电子文件和数字文献的各项管理技术研究。
20世纪90年代末以来,美国国家档案和文件管理局发现其收集的电子文件种类日益丰富,除了数据文件、数据库之外,还有电子邮件、地理空间数据、数字影像等等结构复杂的数据,电子档案管理的难度和复杂程度今非昔比。此外公众迫切希望能够通过在线的方式获取国家档案馆中保存的电子文件。这些压力和挑战促使美国国家档案和文件管理局决定自2000年起建立一个自动化程度很高的集成系统,在实现数字资源提供利用的同时,管理、维护各种类型电子文件,保证其真实、完整和长期可读。该项目就是电子文件档案馆。美国国家档案与文件管理局希望能够设计一个接收、保管和提供利用的系统,它不只是软件系统,还包括政策、工作流程、标准和必需的技术等。与NDAD不同,电子文件档案馆立足于解决任何类型的电子文件(而不仅限于结构数据)对特定硬件和软件的依赖问题,其职责就是不管多长时间,只要社会需要,就能够提供可读和有效的电子文件。
为了实现这样的项目预期,ERA资助了很多研究项目,并与美国国家科学基金会(NSF)进行了深入的合作,其中包括在美国国家圣地亚哥超级计算中心的“档案和电子文件的持久管理”项目;美国国家历史出版物和文件委员会在圣地亚哥超级计算中心的项目“依赖于软件的电子文件的保存和利用”。此外电子文件档案馆还赞助了美国InterPARE5等。这些项目的研究结果将成为美国电子文件档案馆的技术基础。
美国国家档案与文件局称ERA是未来的档案馆,这类档案馆没有局限在某个地理位置上,数字技术保证人们能够通过INTERNET在世界各地方获得档案信息。但从另一个角度来说,ERA在功能上确实等同于传统的实体档案馆。从这个角度来看,KRA确实是一个相对彻底和完善的档案馆信息化项目。
2002年8月14日,ERA向供应商们征集电子文件档案馆的各类解决方案。并决定在2003财政年度的第二个季度召开一次业界的会议。③
3、基于物理实体馆址的数字档案馆
ERA的设计过程中,专家们已经考虑到场所的问题。但就目前来看,ERA项目目前看来还是属于一个集成系统的建设,对于新馆建筑可能会在项目成熟之后开始筹划。英国的NDAD也是一个系统,是一个没有考虑实体建筑的数字档案馆项目。但国际档案界对电子文件、数字信息保管的研究中开始出现一种新的呼声—基于新型的现代化建筑的档案保管策略。这样的建筑可能会更多地考虑合理的网络布线,严格的保管环境和技术环境等要素。和该理论相呼应,2002年6月18日一个基于物理馆址的数字档案馆将在美国华盛顿破土动工。④华盛顿州官员Sam Reed称,这是美国国内第一个组建数字档案馆。这个数字档案馆将立足于解决各类电子文件的管理问题,包括电子邮件、网站文件和政府的数据库文件等。这个投资1430万美元、占地48000平方英尺的数字档案馆大楼预计15年之内将拥有800TB的信息量,这可能相当于2000亿张纸质文件。而且据有关专家的介绍,美国的德克萨斯州今年也开始了同样的数字档案馆项目,并且这两个项目将由美国同一家公司完成。
注释:
①冯惠玲主编,《电子文件管理教程》,北京:中国人民大学出版社,第23页。
②实体的数字档案馆不是基于馆藏数字化,而是基于信息化的全面发展。它包括服务数字化和其他各项业务职能的信息化两部分。服务数字化主要是包括馆藏档案的数字化及存储、压缩、保管和提供利用。而各项业务职能信息化包括:数字文件的保管,数字文献长期可读性的维护,电子文件的归档、传输与管理,电子文件真实性、完整性维护与鉴定等。
③http://www.efs.gov/spg/NARN/NAA/AC/NZ/NA-MA02SEM0009/listing.html
④据IDG(国际数据集团)旗下的计算机世界(COMPUTER WORLD)报道。
(牛角摘自《中国档案》2003年第3期)