经常被问到一个问题:“本体”近年来一直是个十分热门的领域,但是有没有具体应用的成功案例?
这个问题的由来可能有两个方面:
1、大量的本体文章都停留于研究探讨层面,虽然有“本体工程”一词,但是似乎未见真正的“工程”成果,例如像中图法、汉表之类看得到摸得着的成果;
2、缺乏“一剑封喉”或者“刀刀见血”的杀手级应用。
应该说本体领域确实存在上述现象,但这并不是说本体作为时髦一时的词汇已经失去了价值,相反它已经作为一种基本的系统建模和资源组织的思想方法,在当今的计 算机应用、特别是基于互联网和语义的应用方面,几乎是遍地开花、无所不在,可能也正是这个原因,大家并不刻意地去强调和渲染“本体”的作用。
但就上面第一个问题而言,由于当前的本体基本上都是给计算机操作的,因此以机器可识别的方式编码,是本体的一大特征。多种本体编码语言中,基于万维网应用的 OWL目前处于主流地位,Google专门有一个“本体搜索引擎”Swoogle,http://swoogle.umbc.edu能够搜索超过一 万个大大小小的本体OWL/RDFS文档(RDF/RDFS可以认为是OWL的宿主语言)。本体作为一种互联网时代的知识组织规范,其标准化程度可能再也 不会像传统分类法或者叙词表那样,具有“国家标准”的地位,但是它们却是在大量的应用系统背后,起到“行业标准”或“领域规范”的作用。
由于本体有多种含义,有广义、狭义的区分,也有内外之别。广义地来说,作为信息组织的概念模型和基本方式,传统的分类法、叙词表等各种方法都可以转换成本体形式,都可以称之为本 体(这一点可能有争议)。而且大量的领域本体或者企业内部本体是不对外的,是否应用了本体,我们通常可以从用户界面和系统功能方面考察,例如应用了分类主题导航或者分面浏览功 能的很多系统,都可以认为是应用了本体。
本体在最需要严格的知识组织、跨学科综合性海量信息资源管理的领域已经得到很多应用,例如生命科学 (生物多样性,基因工程,医疗卫生疾病防控等)、地球科学(大气监控、环境变化等)、教育资源(特别是英国)。记得最早接触和学习的本体,是联合国粮农组织FAO的项目,他们是这 个领域的先驱,一直做得很好,而且很开放。对于我们这个领域来说,除了大量的知识组织方法可以转化成本体,继续在互联网时代发挥作用之外,FRBR其实也是一种 本体,正在成为下一代编目数据的模型基础,得到广泛的应用,另外我的另两篇博文也谈到与图书情报领域相关的两个本体应用项目:一个可资借鉴的本体应用项目:STERNA;叙词与本体,及其在Elsevier的应用。
原文网址:http://www.kevenlw.name/archives/1243
情报学硕士 胡月红供稿
,