首页 理论教育 本体库构建

本体库构建

时间:2023-02-26 理论教育 版权反馈
【摘要】:因此,我们可以用学科分类来构建叙词本体中的概念C,用叙词来构建叙词本体中的术语I。在本体库中,以类表示叙词。图10-4 叙词的关系模型按照本体中叙词和叙词关系的表示方式,我们利用本体构建工具Protégé手工构建情报学与情报工作领域的初始本体库,作为该领域叙词本体演化的原始版本。
本体库构建_多语种叙词本体

10.2 本体库构建

根据叙词本体的定义以及结构,我们可以以《中国图书馆分类主题词表》为蓝本来构建叙词本体。《中国图书馆分类主题词表》主表中的左部分是分类法,给出了学科分类,右部分则是对应于该分类的叙词。因此,我们可以用学科分类来构建叙词本体中的概念C,用叙词来构建叙词本体中的术语I。学科分类关系就是概念类属关系HC,而叙词表中的叙词之间的“用、代、属、分、参、族”关系就是叙词本体中术语关系RI。另外需要制定一些规则即公理O,以便于之后演化过程需要的推理。

在本体库中,以类表示叙词。由于叙词与叙词之间的关系是多对多的关系,本体中类与类的关系也应是多对多的网状关系。如图10-4所示,图10-4(1)和图10-4(2)表示的是《中医药主题词表》中的几对叙词的“属”关系。图10-4(1)中叙词“白睛病证”与叙词“眼科症状”都为叙词“白睛溢血”的上位词,而图10-4(2)中显示叙词“眼科症状”仍然是叙词“胞睑肿胀”的上位词,叙词与叙词之间在“属”的关系上呈现多对多的关系。同样在“用”、“代”等其他关系上也是如此,叙词与叙词之间是多对多的关系。因此,本体中类与类之间为多对多的关系。如图10-4(2)所示,上位类与下位类在“属”的关系上为多对多的关系。类与类之间的关系通过类的对象属性来实现。在本体中定义“用”、“代”、“属”、“族”、“分”、“参”六个对象属性,用以表示类与类之间的关系。

img117

图10-4 叙词的关系模型

按照本体中叙词和叙词关系的表示方式,我们利用本体构建工具Protégé手工构建情报学与情报工作领域的初始本体库,作为该领域叙词本体演化的原始版本。Protégé工具构建出的本体是用本体描述语言OWL表示。其中,概念之间的定义方式如下:

<rdfs:Class rdf:about="http://www.domain2. com#情报学与情报工作">

<rdfs:subClassOf rdf:resource="http://www.domain2.com#科学_科学研究"/>

</rdfs:Class>

叙词概念之间的关系用、代、属、分、参、族作为概念间的关系定义:

<owl:ObjectProperty rdf:ID="D">

<owl:inverseOf>

<owl:ObjectProperty rdf:ID="Y"/>

</owl:inverseOf>

<rdfs:range rdf:resource="http://www.domain2.com#科学_科学研究"/>

<rdfs:domain rdf:resource="http://www.domain2. com#科学_科学研究"/>

</owl:ObjectProperty>

<owl:ObjectProperty rdf:ID="Z">

<rdfs:range rdf:resource="http://www.domain2.com#科学_科学研究"/>

<rdfs:domain rdf:resource="http://www.domain2. com#科学_科学研究"/>

</owl:ObjectProperty>

<owl:ObjectProperty rdf:ID="S">

<owl:inverseOf>

<owl:ObjectProperty rdf:ID="F"/>

</owl:inverseOf>

<rdfs:range rdf:resource="http://www.domain2. com#科学_科学研究"/>

<rdfs:domain rdf:resource="http://www.domain2. com#科学_科学研究"/>

</owl:ObjectProperty>

<owl:ObjectProperty rdf:about="#F">

<owl:inverseOf rdf:resource="#S"/>

<rdfs: range rdf:resource="http://www.domain2. com#科学_科学研究"/>

<rdfs:domain rdf:resource="http://www.domain2. com#科学_科学研究"/>

</owl:ObjectProperty>

<owl:ObjectProperty rdf:about="#Y">

<rdfs:domain rdf:resource="http://www.domain2. com#科学_科学研究"/>

<rdfs:range rdf:resource="http://www.domain2.com#科学_科学研究"/>

<owl:inverseOf rdf:resource="#D"/>

</owl:ObjectProperty>

<owl:DatatypeProperty rdf:about="http://www.domain2. com#hasChineseTerm">

<rdfs: range rdf: resource=" http://www.w3.org/2001/ XMLSchema#string"/>

<rdfs:domain rdf:resource="http://www.domain2. com#科学_科学研究"/>

</owl:DatatypeProperty>

<owl:SymmetricProperty rdf:ID="C">

<owl:inverseOf rdf:resource="#C"/>

<rdf: type rdf: resource="http://www.w3.org/2002/07/ owl#ObjectProperty"/>

<rdfs:domain rdf:resource="http://www.domain2. com#科学_科学研究"/>

<rdfs:range rdf:resource="http://www.domain2. com#科学_科学研究"/>

</owl:SymmetricProperty>用,代是可以逆转的,定义成逆反属性,而属、分也是可以逆转的,因此也定义成逆反属性,而参为对称的,因此定义成对称属性。而所有的对象属性的值域和定义域都是所有的概念,因此为最上位类的概念。

而隶属于某种概念的(叙词)术语在本体中则以概念实例的形式呈现,用OWL表示如下:

<thes:情报检索rdf:about="http://www.domain2. com#查全率">

<thes:hasChineseTerm rdf:datatype="http://www.w3.org/ 2001/XMLSchema#striaqg">查全率</thes:hasChineseTerm>

</thes:情报检索>

这表示查全率是情报检索的一个叙词,其中thes: hasChinese-Term是查全率的一个值属性,而<thes: hasChineseTerm></thes: hasChineseTerm>之间的查全率是属性值。这样做的好处是:可以增加更多的值属性来描述此叙词,比如用英语来描述这个术语,就可以增加一个值属性<thes: hasEnglishTerm>,用法和中文的用法一样。这样有助于构建多语种叙词本体。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈