您现在的位置: 论文网 >> 管理学论文 >> 档案管理论文 >> 基于本体构建理论的数字档案资源库的构建论文

基于本体构建理论的数字档案资源库的构建

出处:论文网
时间:2017-05-28

基于本体构建理论的数字档案资源库的构建

  传统的数字档案馆是采用基于元数据的关键词检索方式,早已不能满足用户多元化的需求。因此,本文尝试建立一种基于本体论的数字档案馆知识检索模型。通过本体知识、分析理解、概念提取与匹配等方法,从而实现信息检索的智能化。

  一、本体论概述

  本体(Ontology)属于哲学方面的概念,从哲学的角度来说,它是对客观存在的一个系统的解释或说明,关注的是客观现实的抽象本质。1993年,Gruber对此进行了新的定义,认为“本体是概念模型的明确的规范说明”。后来,Borst在此基础上对本体理论进行了完善,认为它是指共享概念模型的形式化规范说明。Studer对此进行研究与总结后提出“本体是共享概念模型明确的形式化规范说明”。“概念模型、明确、形式化、共享”是这一概念中的4大特征,它们是在计算机人工智能方面有知识表达的意思。我们将本体理论运用到数字档案管理信息系统建设中,对档案资源进行描述,并统一数据采集模式,从而实现信息资源的共享与提取。数字档案馆管理系统的主要功能包括借阅管理、档案录入、档案检索、档案备份与恢复等。

  二、数字档案系统利用本体建模流程

  档案管理系统中的本体是档案范畴内的专有概念,用于表示某个专门领域范围内的全部知识。领域本体是专业性范畴,可详细描述出某个学科内的关键词条与这些词条间的关系。有时描述的内容还涉及到该学科内颇有影响力的理论成果。具体来说,档案领域本体就是针对查询功能的档案领域建模的结果。通过充分挖掘将与档案有关的所有查询操作均抽象为同一组概念。档案本体对现实活动中档案的解释,是基于概念结构与抽象空间两个方面的,属于一种系统化过程。创建本体的方法不是唯一的,但能保证本体构建的正确性与完整性。本体构建流程包括四步:确定需求分析、创建共享词库、表示本体、客观评价本体。

  本体中最基本的概念就是类,定义本体中的类实际上就是明确类之间的层次关系,并明确类的属性以及类之间的约束关系。对于概念层次的分析主要有3种方式:分别是自顶向下法、自底向上法、综合法。自顶向下法是指在某一领域中从最大的概念开始,逐步添加子类,从而将概念细化。自底向上法则相反,是从最小的类定义开始,逐步向上将这些相似的类组织在一起形成更大的概念。综合法是将上述两种方法结合起来运用的方法。不管采用何种方法,均是从定义类开始。比如,以档案本体为例,采用自顶向下的方法,其中,最基本的类有档案与档案信息两个。在检索档案信息时,用户可将题目、档案号、分类号、责任者、关键词等作为检索条件。因此,顶层概念就是OWL Thmg,中间层概念包括档案与档案信息,底层概念中档案对应的是档案类别,包括文学档案、历史档案、科技档案等;档案信息对应的是卷宗号、案卷编号、题名、文号、文种、密级、保管期限等信息。

  三、利用Protege构建档案领域本体

  根据目标客户的具体需求来建设档案管理信息,以提高档案管理的工作效率。Protege是基于面向对象的JAVA的一种开发工具,支持类、元类及属性的OKBC兼容。在利用该工具构建本体时共有4个步骤,包括需求分析、确定类与所属层次、明确属性,添加实例。在设计档案检索领域中的本体时,借助该工具生成OWL文件,达到检索目的。

  当需要输入实例时,必须先确定类与属性的结构。比如,要将一个有序的子类插入到已排好序的父类中,可选用数据结构算法描述其中的任何一种插入算法,包括直接插入、两路顺序插入、表插入等。若要添加实例,还需利用Individuals标签内的5个面板,涉及到的属性内容主要有类的思想、实例名称、性能复杂性等。下面,我们以直接插入为例进行阐述:Individual:直接插入排序算法。转化为具体文字描述:某个有序序列[1...,i-1],共有i-1个元素,若要插入r[i],那么,序列的元素个数就变为i个,新序列为r[...i]。在插入时必须注意存放序列的数组不准越界,可采用顺序查找算法,在r[0]的地方设立一个“监视哨”,任何插入操作均是从“i-1”向前挨个搜索,记录能在查找过程中顺序往后移动一个位置。简而言之,排序的过程需完成的插入操作有(n-1)次。将序列中的首个元素作为最简单的有序序列,并从第二个记录开始依次添加到该序列中,直到全部记录均被插入到序列当中。这里的序列是采用关键字进行排序的。

  四、结语

  随着社会的发展,档案数字化的进程进一步加快,数字化档案建设取得了一定的成效,但仍存在不少问题。因此,本文以本体构建论为基础,利用本体的思想与方法,对档案领域的知识进行组合与整合,并通过规范的形式化语言进行描述,以进一步提高数字档案管理效率。

基于本体构建理论的数字档案资源库的构建

论文搜索
关键字:本体 资源库 基于 理论 档案 数字
最新档案管理论文
探究提高档案管理科学化水平的路径选择
人力资源档案管理中运用信息化的必要性探究
如何加强高校档案管理人员的业务培训工作
干部档案材料的分类研究
铁路档案创新管理模式之探析
对下岗失业人员档案管理工作的探究
浅析信息化在科技档案管理中常见问题和解决
现代供电企业的档案管理的相关探讨
铁路企业档案管理工作的问题及对策分析
电子政务环境下政府档案管理模式的转变分析
热门档案管理论文
网络环境下的档案创新服务
如何做好档案管理工作
如何推行档案工作规范化标准化
浅议电子档案的整理与保护
试论档案工作中的保密
推动电子文件归档工作的思考
电子文件对档案工作的影响及对策
试论档案工作中的保密
档案信息自动化系统管理若干问题的思考
谈计算机技术在企业现行文件与档案管理中应