点“兰台之家”,关注设为星标
早上6:00见,发送“签到”,打卡阅读攒积分
打开“公众号”——常看的号“兰台之家”
电子档案管理信息系统,用于存储和管理电子档案数据;档案数字资源管理包括对存储在数据库中的电子档案数据的统一管理和维护;电子档案备份是对数据库中电子档案数据的一种保护和冗余存储措施;电子档案转换与迁移确保即使数据库技术更新换代,电子档案数据也能得到妥善迁移和保存。
如何建设电子档案数据库呢?结合《电子档案管理理论与实务》一书,我们一起来看看。
数据库(DataBase,DB)是存储在计算机内、有组织、可共享的大量数据的集合。数据库可以理解为是一个存放计算机数据的仓库,这个仓库按照一定的数据结构(即数据的组织形式或数据之间的联系)来对数据进行组织和存储,可以通过数据库提供的多种方法来管理其中的数据。数据库系统(Data Base System,DBS)是由数据库、数据库管理系统(及其应用开发工具)、应用系统和数据库管理员(DataBase Administrator,DBA)等组成的存储、管理、处理和维护数据的系统(见图5-12)。
图5-12 数据库系统
档案数据库是以电子档案管理为基础,兼顾数据库设计和应用发展的需要,将档案目录信息、元数据信息、电子档案等各种类型数据按照特定数据模型进行组织的数据集合。档案数据库一般包括目录数据库、元数据库、内容数据库、主题数据库等。
档案目录数据库是关系型数据库,主要通过电子档案管理系统自动采集或从电子档案元数据库中提取形成,部分需要通过人工著录完成。机构各种门类载体档案均应开展目录数据库建设,以卷为单位整理的档案应建立案卷级和卷内文件级目录数据库,以件为单位整理的档案应建立文件级目录数据库。目录数据库建立主要包括三项内容:一是选择档案著录项目,二是确定著录项目数据格式;三是自动采集或录入著录信息。
序号 | 字段 英文名 | 字段中文名 | 类型 | 长度 | 能否为空 | 备注 |
1 | id | 序号 | 字符型 | 10 | ||
2 | department | 保管单位 | 字符型 | 20 | 档案实体保管部门(档案馆接收后填写) | |
3 | unitCode | 档号 | 字符型 | 25 | 否 | 按档号编制规则赋予的一组字符代码 |
表5-11 文书档案目录数据库结构示例(部分)
档案元数据库是关系型数据库,是按照电子档案元数据规范要求建立的档案数据库。档案元数据库可以与档案目录数据库合并建设,也可以统筹规划、分别建设。尤其是在一件电子档案存在多个组件的情况下,需要在建设目录数据库的同时对每个文档的元数据信息进行著录,这种情况下一般需要将目录数据库与元数据库予以分别建设。档案元数据库建设的具体方法和要求可以参照档案目录数据库执行。
档案内容数据库包含全文数据库、多媒体数据库。档案内容数据库是非关系型数据库,是通过数据库技术对文本、图像、图形、声音、视频(及其组合)等电子档案数据进行统一管理的数据库系统。从建设方式上,可以将档案内容数据库看作档案目录数据库与电子档案挂接而成的档案数据库。挂接的方法一般有基于文件方法和二进制域方法两种。
档案数据库建设是电子档案整理归档工作的延续和深化,也是进行电子档案保管与保护、利用与开发、鉴定与销毁、移交与统计等后续工作的重要基础。
档案数据库的建设步骤主要包括建库论证、整体设计、数据组织、审核发布和维护完善五个阶段。
1.建库论证
建库论证首先应选定建库小组的成员,至少要包含档案专家或资深档案工作者、数据库技术专家、某一学科领域专家,以及数据分析、整理、录入人员等。其次要从用户需求、档案资源等几方面着手进行选题分析。在此基础上,确定以用户需求为牵引,以档案资源为基础,以相关资料为依托的档案数据库的选题和类型。
2.整体设计
整体设计包括制定标准规范、选定系统平台、制定建设方案、制定工作计划等。制定标准规范应当包括著录与标引、数字化加工、数据库成果的发布与使用等内容。系统平台则要选择合适的系统开发平台、开发语言以及数据库管理平台。建设方案主要包括确定数据库的层次和规模、设计数据库结构及子库、设计数据库功能(如全文检索、关键字检索等)、确定数据类型(文本、多媒体)、明确成果发布形式等。工作计划主要是确定进度安排、人员分工等,是指导数据库建设的行动指南。
3.数据组织
数据组织阶段是数据库建设的实质性阶段,主要包括数据收集、数据选择、数据加工整理、数据录入、数据存储、数据检查等环节。其中,数据收集除了查阅本单位档案与相关资料外,还应该向其他档案馆、档案形成单位、图书馆等甚至因特网收集。数据录入需要依据标准规范设定著录项目,确保检索入口的多样化,以满足不同用户的不同检索需求和检索习惯。数据存储应根据相关标准规范选定数据存储格式、存储载体,关键是保证数据安全以及检索速度。数据检查应该从数据格式、数据长度、数据内容、空值默认值、一致性等方面进行全面检查,确保数据库中数据的准确、可靠、可读。
4.审核发布
审核发布是在数据库基本建成后正式投入使用前,对数据库进行全方位的检查并最终发布的阶段。审核发布首先要组建由精通档案业务、计算机、数据库、网络等相关知识的专家及工作人员组成的检查小组,审查数据的质量和数量是否达标、数据库的功能是否能满足用户的多样化需求、数据库的运行状态是否稳定等。其次,设定数据库试运行周期和特定用户范围,收集用户使用意见和建议,查找数据库存在的问题和缺陷并及时修补完善。审核完善后应该及时发布并进行宣传,让用户充分了解该数据库的内容、特点、功能及使用方法,最大限度地发挥档案数据库的作用和效益。
档案数据库投入使用后,应当依托三项机制对其进行持续的维护和更新。一是建立用户反馈机制,及时了解数据库是否能满足用户需求,检索过程是否快速、便捷,检索结果是否准确、完备,是否还存在问题和不足等,以便有针对性地对数据库进行改进和升级。二是建设数据追加机制,及时对数据进行追加、替换、删除、修改和整理,在维护档案数据库稳定性的同时,保持数据的新颖性,使档案数据库更完善,利用率更高。三是建立系统维护机制,对系统运行过程中出现的问题及时采取改进措施,使之逐步完善。
编辑:吴凡 责编:贾伟汉
问题反馈宣传合作请留言
投稿邮箱:2438436422@qq.com
▶ 什么是元数据?