基于Protégé的领域本体构建研究

时间:2022-07-15 00:09:51 阅读: 最新文章 文档下载
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
龙源期刊网 http://www.qikan.com.cn

基于Proté的领域本体构建研究

作者:朱丹翔 王璐 郝孝倞 潘宽 来源:《软件工程师》2013年第08

要:介绍了领域本体构建的基本流程,目的是为了更好地服务于语义web以及搜索引擎等。主要内容包括本体的概念、分类、功能及本体构建的方法、语言和工具,并以Java域本体库的构建为例详细阐述了本体的构建过程。

词:领域本体;ProtéOWL;本体构建;语义Web 1.引言

近年来,基于语义的搜索引擎异常火热,而本体作为语义搜索引擎的基石已成为研究热点。本体是现实世界的模型,构建的本体需要能客观反映现实世界。因此,本体的开发流程应该是一个不断反复迭代的过程,这个反复迭代的过程作用于本体的整个生命周期。 2.本体简介

本体最早起源于哲学,其所研究的是世界万物的本源,即所有事物的客观,真实的存在[1]。在计算机领域有许多对本体这个名词不同的解释, 其中比较有代表性的定义是:本体是共享概念模型明确的形式化规范说明。其中,概念模型指通过抽象出客观世界中一些现象的相关概念而得到的模型,明确指所使用的概念及使用这些概念的约束都有明确的定义,形式化指本体是计算机可读的( 即能被计算机处理) 共享指本体中体现的是共同认可的知识,反映的是相关领域中公认的概念集,即本体针对的是团体而非个体的共识[2] 本体根据不同的属性,可以将其进行不同的分类。根据领域依赖程度,可以把本体分为顶级、领域、任务、应用四类。

由于本体功能的强大,目前本体已运用到许多的计算机领域,其中比较突出的是应用于语义网。本体的功能可以总结为三类:

1)作为知识表示方法,主要应用于知识工程和知识管理等[3]

2)作为系统分析方法,应用于信息建模、面向对象分析和数据库设计等[4] 3)作为信息语义的形式化表示方法,应用于异构信息集成、多智能体系统、语义Web等。

3.本体建模


龙源期刊网 http://www.qikan.com.cn

本体建模是一个复杂的过程,涉及了多个学科的知识,包括哲学、逻辑学、知识工程等,目前还没有通用的工程化方法。

本体建模工具主要使用ProtéProté是斯坦福大学基于Java语言开发的本体编辑和知识获取软件,或者说是本体开发工具,它提供了大量的知识模型架构与动作,用于创建、可视化、操纵各种表现形式的本体。

本体描述语言使用OWLWeb Ontology Language)。OWLW3C开发的一种网络本体语言,用于对本体进行语义描述,有三种子语言,即OWL LiteOWL DLOWL Full,而且每个子语言的表达能力递增。

1OWL Lite语言,它属于OWL DL语言,主要提供给分类层次比较单一和属性约束比较简单的使用者。

2OWL DL语言,它涵盖了OWL语言的所有语言成分,但使用时必须符合一定的约束,受到一定的限制。OWL DL提供了描述逻辑的推理功能,描述逻辑是OWL的形式化基础。

3OWL Full语言,它包含OWL的所有语言成分并取消了OWL DL中的使用约束,它RDFS扩展成为一个完备的本体语言,支持那些无计算性保证但需要非常强表达能力和无使用限制的用户。 4.领域本体构建实例

为了能更好的阐述本体的构建流程,下面以Java领域本体的构建过程为例描述本体构建的基本方法。学科知识可划分成多个知识点, 知识点是系统处理的单元。知识点的大小是根据一定的教学策略或经验、教学目的和教学对象等确定的, 其大小相差可能很悬殊[5]。本文使用的建模工具是Proté4.2,选择的本体描述语言是OWL Full。本体构建过程主要分为以下八步,具体如图1所示。

1)确定本体的领域和范围。本实例构建的本体是针对Java领域,所以将Java的所有知识点收集全是本体构建的基础。

2)领域信息的收集和分析。确定好范围后就可以收集目标领域的概念及信息,例如Java的知识点有封装”“继承”“多态”“线程等。

3)重点概念和关系的确定。确定各个知识点之间的关系,最普通的关系可以是part-of,其他的关系也可以自己定义。每个关系还可以定义逆关系,例如自动装箱的逆关系为自动拆箱


龙源期刊网 http://www.qikan.com.cn

4)建立本体框架。按照一定的逻辑规则将知识点进行分组,一个本体的框架就大致建立好了。

5)形式化编码。本研究选择Proté工具对上述本体框架进行形式化编码。 6)集成现有本体。对本体库进行优化时,这一步必不可少。

7)确认和评价。本体建立好后就要投入实际应用过程中,评估标准基本包括:正确性、一致性、可扩展性和有效性。

8)本体进化。一个好的本体库只有对此过程不断的迭代,才能不断完善。

2Java领域本体用Proté形式化编码后的二级缩略图,使用Proté可以自动生成对应的OWL代码。这样,一个Java领域本体构建完毕。 5.小结

领域本体的构建依赖于现实世界,由于现实世界是不断变化的,因此构建的本体也需要不断的改善。本文在进行本体构建时采用的是手动构建的方式,未来将尝试使用半自动化甚至自动化的技术构建本体。 参考文献

[1] 李善平,等.本体论研究综述[J].计算机研究与发展,2004417):1041 -1052. [2] STUDER RBENJAMINS V RFENSEL D.Knowledge engineeringprinciples and methods[J].Data and Knowledge Engineering1998251/2):161-197.

[3] FEBSEL D.Ontology2based know ledge management[J].IEEE Computer20023511):56259.

[4] GUARINO N. Formal ontology and information systems[A].In Proceedings of FOIS’98[C].TrentoIO S Press1998.

[5] 赵蔚,刘秀琴,邱百爽.语义网自适应学习系统中领域本体的构建[N].吉林大学学报(信息科学版),2008265):514-518.


龙源期刊网 http://www.qikan.com.cn






本文来源:https://www.wddqw.com/doc/8b41d95801768e9951e79b89680203d8ce2f6a26.html