龙源期刊网 http://www.qikan.com.cn
电子档案存储方式的选择
作者:李骏仁 朱晓钟 来源:《硅谷》2010年第09期
摘要: 在对电子档案的分类管理过程中,文件格式的选择决定着整个数字化过程的成败和效率,决定着能否对电子档案进行长期、有效的管理。在确定档案文件格式时,必须综合考虑所选用格式的保真度、文件大小、与软硬件平台的相对性、通用性、标准化程度、数字化档案的目的等因素,使电子档案能够长期有效的使用和借阅。 关键词: 存储方式;档案管理;长期有效
中图分类号:TP3文献标识码:A文章编号:1671-7597(2010)0510111-01
档案的数字化过程是将存在于现实中的客观的传统档案信息经过数字化过程,输入到网络中,借助于网络环境来管理和应用。具体地说,就是将传统的纸质档案、照片档案、声像档案里的内容转化成以二进制数字代码形式记录,成为计算机网络所能识别的数字信息。因此,数字化的实质是在保持所记录信息不变的情况下转换了档案信息的记录方式和载体。目前存在的众多的存储方式为电子档案的管理既提供了方便,也造成了混乱。因此,需要根据管理特点对电子档案的存储方式做出选择。 1 统一电子档案格式的必要性
档案信息数字化过程设计许多技术问题,如数字化采集设备的选择、数字文件格式的选择、文件存储系统的建立等。其中,关键问题是数字文件格式的选择。因为数字文件格式选择的正确与否,决定着整个档案数字化进程,决定着档案分类管理的有效性和档案的长期有效使用和借阅。文件格式必须在数字化之前确定,并且一旦确定便不能随意改变,格式的随意改变或多样性将给档案的分类管理造成难以想象的困扰。
随着科技的日益进步,数字文件格式本身正在不断更新和发展,这种存储格式不断变动的形势就给档案工作的管理层造成了困难,使得他们也难以决定采用何种存储格式。因此,电子文件的存储格式问题也就成为阻碍档案数字化的主要障碍。亟需研究电子档案格式选择的要求,以促进档案数字化进程。 2 电子档案格式选择的要求
2.1 文件的保真度。数字化过程是对档案内容的拷贝,信息转移的过程由于信息表达方式的变化而极易造成档案信息的失真。因此,选择电子文件格式时,必须考虑其保真程度。这是数字
龙源期刊网 http://www.qikan.com.cn
化过程的基本要求,任何格式的数字文件都存在不同程度的失真,要将失真度控制在可允许的范围内,可允许保真程度需要根据档案数字化目的的不同而适当调整。
2.2 文件大小及费用。数字档案文件通常需要长久保存,也许在初期档案数字化存储空间上的压力并不大,但随着时间累积,其空间必将累积到极限。同一档案在数字化时采用不同的数字格式,所占用的存储空间相差很大。所以文件大小也成为选择文件格式时所要考虑的重要因素。支持所选电子格式的软件应该易于得到,获取支持软件的费用比较小。
2.3 通用性和可移植性。网络中的主机具有多样性,既可以是计算机硬件的不同,也可以是软件的不同。因此数字化档案应具有良好的可移植性,可以在不同的机器、不同的软件平台下保持良好的可读性,而不受软硬件平台的。较好的通用性与移植性可以使用户很容易得到存取该文件的软件,便于用户对该数字化档案的存取,同时文件管理部门与档案部门也不必专为保存该类文件而保留其专用的阅读软件,从而减少管理程序与管理费用,便于资源共享。 2.4 标准化程度。考虑标准格式或规范化程度较高的文件格式,一是出于所选格式的通用性、技术开放性考虑,二是标准格式或规范化程度较高的文件格式通常在技术上更为科学合理。
3 基于文字型数据文件的电子格式选择分析
3.1 PDF。PDF是由Adobe公司开发的一种通用文件格式,能够保存任何源文档的所有字体、格式、颜色和图形,忠实地再现文件的每一个字符、颜色以及图像,而不管创建该文档所使用的应用程序和平台。
PDF文件比源文件小,在Web上下载文件的同时可以快速地显示页面,而不会降低网络速度。利用者只要得到第一部分数据,可以按需继续下载其它的页面。也就是说利用者看完第一页可以立即跳到第八页,不用浪费时间去等下载。从这个意义上说,PDF非常适合网上传输。 PDF需要专门的阅读器Alcrobat Reader来读取。Acrobat Resder可以很方便地得到。 3.2 CAJ。清华大学开发的CAJ文件格式,支持中国期刊网的CAJ、NH、KDH和PDF格式文件。CAJ封装文字和插图信息在单一的文件中,完整保留原来文件的版式信息,打印效果与原版的效果一致。根据它的以上特点,可以考虑在档案数字化中使用这种格式。CAJ格式文件的阅读器可以在期刊网的首页免费下载,CAJ的格式转换软件可以将电子文件转换生成CAJ文件。
3.3 CEB。CEB是北大方正开发的完全高保真的中文电子文档格式。CEB可以较好地保持文件原版样式,能够保留原文件的字符、字体、版式和色彩,包括图片、数学公式、化学公式、表格与文件中的圈注、批注、划线等一切信息。
龙源期刊网 http://www.qikan.com.cn
CEB系统支持汉语、少数民族语言、英语等多种语系,可以完成自动分类、自动摘要、图片检索等操作,可极大地减轻档案管理人员的工作负担。CEB具有的数字签名、数据加密功能,可以使档案管理人员在保护档案知识产权的基础上,有权限地为用户提供利用。
Apabi Maker是电子文档的转换软件,能够将TXT、RTF、PS、S2、S72、PS2、EPS、TIFF、DOC等格式的文件转换为用于阅读的电子文件格式CEB。
CEB格式得到了国家电子政务标准化总体组的肯定,国家有关部门己把CEB格式作为电子公文传递的标准格式。
3.4 三种格式的比较选择。比较这三种格式,从打印效果来看,PDF,CAJ与CEB格式都保持原刊版式,基本没有差别;从传输速度来看,CAJ与CEB压缩比更高,更有利于网上传送;PDF是外国公司Adobe的产品,而CAJ和CEB是我国拥有完全自己知识产权的产品,从安全性与费用等多方面考虑,CAJ与CEB格式更适合我国档案工作的实际情况。从我过实际使用情况看,CEB更多地用在了公文处理与保存方面,CAJ则关注于学术期刊领域。综上所述,CEB是最适合档案管理的电子格式。 4 结语
每种类型的文件都有多种多样的格式,基于文件保真度、文件大小及费用、与软硬件平台的相对性、通用性和可移植性、标准化程度等多方面因素的综合考虑,选择合适的电子文档格式,以推动我国的档案分类管理工作,有利于利用者长期有效的使用和借阅。未来的档案管理工作可能会摆脱文件格式相异的,为档案分类管理工作带来变革,但基于现阶段的科技水平,只能在对不同文件格式具体分析之后决定选用何种格式。
参考文献:
[1]刘家真,文件保存格式与PDF文档,档案学研究,2002(2). [2]张照余,数字化档案的文件格式选择,档案学通讯,2003(6). [3]李泽锋,文字性数据文件的电子格式研究,档案管理,2004(6). [4]杨晶,数字档案馆信息检索系统的研究与实现,2007(1). [5]付虎,PDF格式与电子文件管理,北京档案,2003(3).