龙源期刊网 http://www.qikan.com.cn 基于Protégé的领域本体构建研究 作者:朱丹翔 王璐 郝孝倞 潘宽 来源:《软件工程师》2013年第08期 摘 要:介绍了领域本体构建的基本流程,目的是为了更好地服务于语义web以及搜索引擎等。主要内容包括本体的概念、分类、功能及本体构建的方法、语言和工具,并以Java领域本体库的构建为例详细阐述了本体的构建过程。 关 键 词:领域本体;Protégé;OWL;本体构建;语义Web 1.引言 近年来,基于语义的搜索引擎异常火热,而本体作为语义搜索引擎的基石已成为研究热点。本体是现实世界的模型,构建的本体需要能客观反映现实世界。因此,本体的开发流程应该是一个不断反复迭代的过程,这个反复迭代的过程作用于本体的整个生命周期。 2.本体简介 本体最早起源于哲学,其所研究的是世界万物的本源,即所有事物的客观,真实的存在[1]。在计算机领域有许多对本体这个名词不同的解释, 其中比较有代表性的定义是:“本体是共享概念模型明确的形式化规范说明”。其中,“概念模型”指通过抽象出客观世界中一些现象的相关概念而得到的模型,“明确”指所使用的概念及使用这些概念的约束都有明确的定义,“形式化”指本体是计算机可读的( 即能被计算机处理) ,“共享”指本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,即本体针对的是团体而非个体的共识[2]。 本体根据不同的属性,可以将其进行不同的分类。根据领域依赖程度,可以把本体分为顶级、领域、任务、应用四类。 由于本体功能的强大,目前本体已运用到许多的计算机领域,其中比较突出的是应用于语义网。本体的功能可以总结为三类: (1)作为知识表示方法,主要应用于知识工程和知识管理等[3]。 (2)作为系统分析方法,应用于信息建模、面向对象分析和数据库设计等[4]。 (3)作为信息语义的形式化表示方法,应用于异构信息集成、多智能体系统、语义Web等。 3.本体建模 龙源期刊网 http://www.qikan.com.cn 本体建模是一个复杂的过程,涉及了多个学科的知识,包括哲学、逻辑学、知识工程等,目前还没有通用的工程化方法。 本体建模工具主要使用Protégé。Protégé是斯坦福大学基于Java语言开发的本体编辑和知识获取软件,或者说是本体开发工具,它提供了大量的知识模型架构与动作,用于创建、可视化、操纵各种表现形式的本体。 本体描述语言使用OWL(Web Ontology Language)。OWL是W3C开发的一种网络本体语言,用于对本体进行语义描述,有三种子语言,即OWL Lite、OWL DL和OWL Full,而且每个子语言的表达能力递增。 (1)OWL Lite语言,它属于OWL DL语言,主要提供给分类层次比较单一和属性约束比较简单的使用者。 (2)OWL DL语言,它涵盖了OWL语言的所有语言成分,但使用时必须符合一定的约束,受到一定的限制。OWL DL提供了描述逻辑的推理功能,描述逻辑是OWL的形式化基础。 (3)OWL Full语言,它包含OWL的所有语言成分并取消了OWL DL中的使用约束,它将RDFS扩展成为一个完备的本体语言,支持那些无计算性保证但需要非常强表达能力和无使用限制的用户。 4.领域本体构建实例 为了能更好的阐述本体的构建流程,下面以Java领域本体的构建过程为例描述本体构建的基本方法。学科知识可划分成多个知识点, 知识点是系统处理的单元。知识点的大小是根据一定的教学策略或经验、教学目的和教学对象等确定的, 其大小相差可能很悬殊[5]。本文使用的建模工具是Protégé4.2,选择的本体描述语言是OWL Full。本体构建过程主要分为以下八步,具体如图1所示。 (1)确定本体的领域和范围。本实例构建的本体是针对Java领域,所以将Java的所有知识点收集全是本体构建的基础。 (2)领域信息的收集和分析。确定好范围后就可以收集目标领域的概念及信息,例如Java的知识点有“封装”“继承”“多态”“线程”等。 (3)重点概念和关系的确定。确定各个知识点之间的关系,最普通的关系可以是part-of,其他的关系也可以自己定义。每个关系还可以定义逆关系,例如“自动装箱”的逆关系为“自动拆箱”。 龙源期刊网 http://www.qikan.com.cn (4)建立本体框架。按照一定的逻辑规则将知识点进行分组,一个本体的框架就大致建立好了。 (5)形式化编码。本研究选择Protégé工具对上述本体框架进行形式化编码。 (6)集成现有本体。对本体库进行优化时,这一步必不可少。 (7)确认和评价。本体建立好后就要投入实际应用过程中,评估标准基本包括:正确性、一致性、可扩展性和有效性。 (8)本体进化。一个好的本体库只有对此过程不断的迭代,才能不断完善。 图2是Java领域本体用Protégé形式化编码后的二级缩略图,使用Protégé可以自动生成对应的OWL代码。这样,一个Java领域本体构建完毕。 5.小结 领域本体的构建依赖于现实世界,由于现实世界是不断变化的,因此构建的本体也需要不断的改善。本文在进行本体构建时采用的是手动构建的方式,未来将尝试使用半自动化甚至自动化的技术构建本体。 参考文献 [1] 李善平,等.本体论研究综述[J].计算机研究与发展,2004,41(7):1041 -1052. [2] STUDER R,BENJAMINS V R,FENSEL D.Knowledge engineering,principles and methods[J].Data and Knowledge Engineering,1998,25(1/2):161-197. [3] FEBSEL D.Ontology2based know ledge management[J].IEEE Computer,2002,35(11):56259. [4] GUARINO N. Formal ontology and information systems[A].In: Proceedings of FOIS’98[C].Trento:IO S Press,1998. [5] 赵蔚,刘秀琴,邱百爽.语义网自适应学习系统中领域本体的构建[N].吉林大学学报(信息科学版),2008,26(5):514-518. 龙源期刊网 http://www.qikan.com.cn 本文来源:https://www.wddqw.com/doc/8b41d95801768e9951e79b89680203d8ce2f6a26.html