刚写下这个题目的时候我多少有一种时空错位的感觉,关于电子文件管理对象的讨论(包括电子文件的概念、电子文件的特性以及电子文件分类的研究)是十几年前电子文件管理研究刚刚兴起时的热门话题,而当前电子文件管理的标准已经纷纷出台、各种各样的电子文件管理系统层出不穷、全国各地的电子文件中心建设方兴未艾,在这种形势下,再来探讨电子文件管理对象多少显得有些不合时宜。但是我认为正是由于档案界已经大踏步地跨进电子文件管理的实践阶段,因此学术界对于电子文件的所有研究和认识都必须转化为普通档案工作者可以看得见、摸得着、在实践中可以确认和分辨的东西,其中电子文件管理对象依然是最基本、最重要的问题。
一、现行政策标准对电子文件管理对象的描述
《电子文件归档与管理规范》(gb/t 18894-2002)是国内档案界关于电子文件管理最权威、最基础的标准,各地出台的有关电子文件管理的地方性标准和法规几乎都是以此为蓝本制定的。在这个标准中,电子文件被定义为:在数字设备及环境中生成,以数码形式存储于磁带、磁盘、光盘等载体,依赖计算机等数字设备阅读、处理,并可在通信网络上传送的文件。
这是一个非常宽泛的定义,在这个定义下所有计算机中的文件都是电子文件。现在任何一台个人计算机中都至少有十几万个这样的文件,更不要说大型的服务器和存储系统。显然,把如此多的文件纳入档案管理的范围是不适宜的,也是一项无法完成的任务。
应该说在这里我故意混淆了概念,我所说的“计算机中的文件”是指计算机科学中的文件概念,而不是文书学、档案学中的文件概念。作为一个档案行业的标准,《电子文件归档与管理规范》中的“文件”确实更可能指向文书学、档案学中的文件,而非其他学科中的相似概念。但由于《电子文件归档与管理规范》没有定义“文件”这个概念,因此我所做的混淆就不是完全的空穴来风。事实上,我的确怀疑标准中的“文件”的含义更多地来自计算机科学。
在标准中还有关于电子文件分类的规定:
电子文件类别代码:t——文本文件;i——图像文件;g——图形文件;v——影像文件;a——声音文件;o——超媒体链接文件;p——程序文件;d——数据文件。
如果说文件概念还存在歧义,那么这个分类标准毫无疑问是计算机科学的。只有计算机科学中的文件我们才能严格按照这个分类划分,而一份文书学、档案学意义上的文件往往是上述多种类型的混合。
或许有人会说,对于一个事物的类别可以从多种角度划分,在文书学和档案学中,我们对于文件就是按照文种、行文方式甚至载体类型等多种角度划分的,对于电子文件这种与计算机密切相关的文件形态,引入计算机科学的分类方式也不无道理。
必须承认,这种反诘是有力的,我的本意也不是讨论目前档案界普遍流行的关于电子文件的定义和分类是否科学。但是这种定义和分类至少在档案学角度上是不够清晰的,或者说它离我们熟悉的、实践中必须使用的概念、术语是有距离的。实际上,在对于电子文件管理对象的研究乃至整个电子文件管理的研究中一直存在着的一种泛技术化的倾向,即过于关注电子文件管理所需的计算机技术细节,而忽略了从档案学角度去理解、研究电子文件;专注于从电子文件本身孤立地进行研究,而忽略了在档案工作大背景下讨论电子文件管理与传统档案管理的关系。这种泛技术化的倾向在研究中未必不是一个必须的阶段,但是在实践中则造成了很多的问题。
二、泛技术化倾向给电子文件管理实践带来的问题
1、电子文件与传统载体档案的关系复杂
电子文件是一个单独的档案门类吗?还是它仅仅是传统档案的一种不同形态?
档案界在最初研究电子文件时是把电子文件作为一种新型载体的档案来看待的,现在虽然我们已经认识到电子文件与传统档案相比绝不仅仅是载体形式的变化,但是在管理中依然存在着把电子文件作为特殊载体档案来管理的趋势。这种趋势是有其传统的,在档案管理的历史上不断有新型载体档案的出现,如照片、音频、视频档案等,这些新型载体档案最终都衍生为一个专门的档案门类,有着独立的编号、独立的目录和独立的保管要求。但是电子文件与过去那些新型载体不同,无论照片还是音频、视频,它们与更传统的纸质档案之间虽然在内容上存在着千丝万缕的联系,但彼此之间是补充关系,纸质、照片、音频、视频可能同时用来记载一个活动,但是它们的具体内容和表现形式各不相同。但电子文件与传统载体档案的内容和表现形式可以完全相同,呈现出一种替代关系。
如何在档案管理中把握这种关系呢?一个现实的问题是,当我们接收一个单位的传统载体档案和电子文件时,电子文件的目录是应该单独建立数据库还是并入传统载体档案目录数据库?如果单独建立电子文件数据库,那么同一份文件既有传统载体又有电子文件,在档案统计时如何计算?这些都是电子文件管理的细节问题,但是尴尬的是在档案界对电子文件进行的大量研究中我们很难找到这些细节问题的答案,甚至是解决思路,而这些细节又恰恰是我们开展实际工作必须解决的问题。
2、电子文件管理的指导和实践之间存在错位
在所有关于电子文件管理的政策、标准、规定中,都把电子文件以及电子文件归档后产生的“电子档案”看做是真正意义上的文件、档案。而在实践中,几乎所有的地区和单位都依然把传统载体档案当作真正的档案(即便它是根据“双套制”原则由电子文件生成的),而电子文件仅仅作为这些传统载体档案的一种更为方便利用的形式。换句话说,如果我们把所有的电子文件看成是传统载体档案经过数字化加工而形成的电子副本丝毫不影响工作。究竟是电子档案还是传统档案的电子副本,表面看起来是个定义问题,是个看问题的角度问题,但实质上这个问题关系到我们电子文件管理研究和实践的重点应该放在哪里。
3、跛足的“双套制”
现阶段电子管理的一个重要原则就是“双套制”,即“具有永久保存价值的文本或图形形式的电子文件,如没有纸质等拷贝件,必须制成纸质文件或缩微品等。归档时,应同时保存文件的电子版本、纸质版本或缩微品”。这个原则从一出台就在学术界饱受诟病,被指为保守、落后,阻碍电子文件管理的发展。如果说学界的批评还多少包含理想化的成分,显得有些激进,那么在实践中“双套制”带来的困难已经开始真正阻碍电子文件管理的发展。现有的“双套制”是不彻底的双套制,仅仅是片面强调电子文件的纸质化,而没有把传统载体档案的数字化与之结合起来。这就使得传统载体档案特别是纸质档案和电子文件不是严格的一一对应,一方面很多纸质档案没有电子副本,男一方面并不是所有的电子文件都生成了纸质版本。传统载体档案与电子文件并存但不能一一对应,这种不彻底的“双套制”无论对于机关档案室对电子文件的保管和利用还是对于将来向各级档案馆的移交都带来了很多问题。
三、从实践角度对电子文件管理对象的再认识
电子文件管理是信息时代档案工作面临的最严峻挑战,是一项长期而艰巨的任务,对此我们必须有清醒地认识。电子文件管理必须依据统筹规划、分步实施的原则,有计划、有重点、循序渐进地展开,不能一蹴而就。开展电子文件管理实践的首要问题就是要明确电子文件管理对象,根据电子文件的不同性质和特点有针对性地开展工作。
我认为纳入档案管理的电子文件可以大体上分为三类,即原生性电子文件、电子副本和资料性数字信息。
原生性电子文件是指在计算机中产生,并且在实际业务活动中本身具有法律效力的电子文件,或者说是符合《电子签名法》的要求,能够直接被法庭采信的等同于书证的电子文件。只有这类电子文件是真正意义的电子文件,或者说是当前电子文件管理学术研究中真正关注的电子文件。只有这种电子文件才需要我们去前端控制、去全程管理,需要我们运用is015489、is023081的原则,需要我们记录多达百项的元数据来确保其真实性、完整性和有效性。这种类型的电子文件在我们身边随处可见,从自动取款机提款到各种电子消费,从企业网上年检到网上申报纳税,这种电子文件在社会生活中发挥着重要作用。但是从档案管理的角度来看,或者更明确地站在档案事业的主体——档案馆的角度来看,这些电子文件并不是重要的档案,甚至绝大多数都不在接收进馆的范围内。虽然不进馆的定期档案我们也要管理,但是对于电子文件管理而言长期保存才是难题所在,而对于短期保存我们完全可以相信技术部门有很好的解决方案。
电子副本,也可称为传统载体档案的数字化副本。它包括除了我们通过传统载体档案数字化工作生成的电子文件外,还包括几乎所有oa系统产生的电子公文。虽然在一个有较为完备的oa系统运行的单位中,纸质文件的产生后于同内容的电子文件,严格来说纸质文件才是副本。但是由于在现行的法律框架和管理体制当中,纸质文件才是最终具有法律效力的文本,所以我们完全可以把电子文件视为纸质文件的副本。这种角色的转换可以避开电子文件管理中最复杂、最核心的问题,即电子文件真实性的长期保存,因为作为副本其真实性的判定有一个简单的方法,即与原件相对照。因此,只要一份电子文件存在着一个同内容的具有法律效力的传统载体的文本,我们就可以把这份电子文件看做是电子副本,我们对这份电子文件的管理就可以集中在完整性和有效性保障方面,而电子文件的完整性和有效性就当前的理论和技术而言都是有着充分的保障的。
除了上述两种电子文件外,还有一类电子文件也应纳入我们管理的范畴,即资料性数字信息,主要包括各种数据库、网站等。这种类型的数字资源并不是严格意义的档案,因为它们都是由更原始的电子文件所包含的信息组成的。它们类似于传统档案中的编研材料,虽然不具有凭证价值,但是由于在实际中发挥着重要作用,可以作为研究查考的资料。
在三类电子文件中,电子副本存量最大、利用效果最明显、管理条件也最成熟,应该作为实际工作的重点。资料性数字信息对于丰富馆藏资源、扩大档案服务范围具有重要作用,应该积极主动、创造性地开展收集工作。而原生性电子文件,是未来档案工作需要解决的问题,现阶段应持续开展研究,从源头上保证其真实、完整、有效。