5.4.2 有含义代码
有含义代码是指代码不仅能代表编码对象,其本身还具有一定的含义,从代码本身就能看出其编码对象的一些特征,便于交流、传递、交换和代码的编制。有含义代码包括缩写码、层次码、矩阵码、并置码、组合码、复合码和镶嵌式组合码等。
1.缩写码
缩写码的本质特性是依据统一的方法缩写编码对象的名称,由取自编码对象中的一个或多个字符赋值成编码表示。
缩写码可有效地用于那些相当稳定的、并且编码对象的名称在用户环境中已是人所共知的有限标识代码集。
示例:GB/T 2659-2000《世界各国和地区名称代码》中,部分国家和地区的字母代码见表5-4。
表5-4 部分国家和地区的字母代码
缩写码的优点是用户容易记忆代码值,从而避免频繁地查阅代码表,可以压缩冗长的数据长度。其缺点是编码表达式依赖编码对象的初始表达(语言、度量系统等)方法,在每次增加代码值后,如果不重新检查全部的代码值,则缩写过程的结果就不能保证代码值的惟一性。
2.层次码
层次码常用于线分类,它是按分类对象的从属关系和层次关系为排列顺序的一种代码。对产品来讲,这个排列顺序可以是按工艺、材料、用途等属性来排列的。
编码时,将代码分为若干层级,以编码对象集合中的层级分类为基础,将编码对象编码成为连续且递增的组(类)。位于较高层级上的每一个组(类)都包含并且只能包含它下面较低层级全部的组(类)。这种代码类型以每个层级上编码对象特性之间的差异为编码基础。每个层级上的属性必须互不相容。
细分至较低层级的层次码实际上是较高层级代码段和较低层级代码段的复合代码。
层次码的一般结构如图5-2所示。
层次码通常用于分类的目的,较少用于标识和参照的目的。层级数目的建立依赖于信息管理体制的需求。
层次码非常适合于诸如编制统计目的、报告货物运转、基于学科的出版
图5-2 层次码结构
分类等情况。在实际运用中,既有固定格式,也有可变格式。固定格式比可变格式更容易处理一些。
示例1:固定递增格式。GB/T 13745-992《学科分类与代码》中的学科
代码由3个数字位组成,下一级学科相对于上一级学科按固定的确位代码段递增,其部分代码见表5-5。
表5-5 部分学科分类与代码
示例2:可变递增格式。在通用十进制分类法(UDC)中,字符的数目和编码表达式的分段是可变的,其细节描述的程度能被延伸到想要达到的层级。如“建筑学的屋顶坡度”这样一个概念可被编码表达式表达成624.024.13。
624 土木工程
624.02 建筑物成分
624.024 屋顶、屋顶用材料
624.024.10 屋顶坡度
层次码的优点是能明确表示分类对象的类别。代码本身具有严格的隶属关系,易于编码对象的分类或分组能在较高的合计层级上汇总,各层代码在分类上都具有一定的含义,代码值可以解释。而且层次码代码结构简单,容量大,同时便于机器求和和汇总。
层次码的缺点是限制了理论容量的利用,因精密原则而缺乏弹性,个别分类上的改变、删除或插入就可能影响其他的代码。当层次较多时,代码位数太长。层次码还需要随代码层级的顺序从最高层级向下赋予代码值或者解释代码值。此种代码由于是先分类后编码,必须制定一定的分类规范和说明。层次码的复杂性取决于层级数目,并导致要重新介绍已经应用于较高层级上的特性。
3.矩阵码
矩阵码是一种建立在多维空间坐标位置基础上的代码,代码的值是通过赋予多维空间坐标的代码组合而成的,或是通过赋予多维空间位置序号构成的。
矩阵码以复式记录表的实体为基础。赋予这个表中行和列的值用于构成表内相关坐标上编码对象的代码表示。
这种方法的目的是对矩阵表中的编码对象赋予有含义的代码值,这些编码对象在不同的组合中具有若干共同的特性。
矩阵码可有效地用于标识那些具有良好结构和稳定特性的编码对象。
示例:GB 2312-1980《信息交换用汉字编码字符集基本集》根据矩阵码编码方法对汉字信息交换用的基础图形字符编制了区位码,其中,区号为矩阵表中的行号,位号为矩阵表中的列号。汉字字符“啊”用区位码16-01编码表示,在这里,16为区号,01为位号。同理,拉丁字符“A”用区位码03-13编码表示,图形字符“……”用区位码01-13表示。
矩阵码的优点是:由于矩阵码是在多维空间坐标位置的基础上构成的,因此,代码逻辑关系明确,代码容易编制,也容易解释其代码值。
矩阵码的缺点是:要预先建立表,对应一定的逻辑关系,覆盖编码对象的全部特性,因而难以适应新的要求,如新的或更改的特性以及新的组合等。
4.特征组合码
特征组合码是由一些代码段组成的复合代码,这些代码提供了描绘编码对象的特性,这些特性是相互独立的。这种方法的编码表达式可以是任意类型(顺序码、缩写码、无序码)的组合。
特征组合码又称为并置码,常用于面分类中,将分类对象按属性分成若干个“面”,每个“面”内的各个类目按其规律分别进行编码。因此,“面”和“面”之间的代码没有层次关系,也没有隶属关系。使用时,根据需要选用各“面”中的代码,并按预先确定的“面”的排列顺序将代码组合起来,以表示这个组合的类目。
特征组合码非常适用于那些具有若干共同特点的分类。
示例1:轨道编码,见图5-3,等级、形状、尺寸这三个特性在很大程度上是相互独立的。
图5-3 轨道编码
示例2:机制螺钉的编码
对机制螺钉,可选用材料、螺钉直径、螺钉头形状及螺钉表面处理状况四个“面”,每个“面”内又分为若干个类目,并分别编码(见表5-6)。
表5-6 机制螺钉的并置码编码
特征组合码的优点是:以代码值表现出一个或多个特性为基础,可以很容易地对编码对象进行分组,容量与每个特性可能含有的值的数量相联系,代码值可以解释。另外,该代码具有一定的柔性,能比较简单地增加分类“面”的个数,必要时,还可更换个别的“面”,适于机器处理信息。同时,在使用时,可用全部代码,也可用部分代码。根据“面”的特征及“面”内的代码符号,便可确认分类编码对象的特性。
特征组合码的缺点是:因含有大量的特性,可导致每个代码值有许多字符,难以适应新特性的要求。这种代码的利用率较低,因为分类编码对象的属性不可能都存在组配关系,因而不是所有的可组配的代码都有实际意义,都能全部被采用。此外,这种代码不适于求和汇总。
5.组合码
组合码也是由一些代码段组成的复合代码,这些代码提供了编码对象的不同特性。与特征组合码不同的是,这些特性相互依赖,并且通常具有层次关联。组合码经常被用于标识目的,以覆盖宽泛的应用领域。示例1:GB 11643-1999《公民身份号码》,见表5-7。
表5-7 公民身份证格式
整个18位组合码共分4段,前两个代码段标识了编码对象(公民)的空间和时间特性,第三个代码段则依赖于前两个代码段所限定的范围,第四个代码段依赖于前三个代码段赋值后的校验计算结果。
组合码的优点是:代码值容易赋值,有助于配置和维护代码值,能够在相当程度上解释代码值,有助于确认代码值。其缺点是:理论容量不能充分利用。
6.复合码
复合码通常是由两个或两个以上完整、独立的代码组成。例如,“分类部分+标识部分”组成的复合码是将分类编码对象的代码构成分为分类部分和标识部分两段。分类部分表示分类编码对象的属性或特征的层次、隶属关系。标识部分起着分类编码对象注册号(即登记号)的作用,常采用顺序码或系列顺序码。
如适用于北美和北约集团国家的美国物资编码,就是采用十三位的数字复合码,其代码结构如图5-4所示。其中,标识部分是由美国及北约集团国家编码的二位数字的代码和物品识别的七位数字代码组成的。美国物资编码标识码必须是美国及北约集团国家编码局代码和物品识别编号,九位数字码联合使用。只有这样,才能保证其完整性,才能真正做到一物一码,起到惟一标识的作用。
复合码的优点是:代码结构具有一定的柔性,易于扩大代码的容量和调整分类编码对象的所属类别。同时,代码的标识部分可以用于不同的系统,因而便于若干个系统之间的信息交换。
图5-4 美国物资编码代码结构
复合码的另一种形式为“层次+标识部分”,如表5-8所示。此种代码由两部分组成,第一部分为层级代码,表示分类编码对象在分类结构上的层级。第二部分为标识部分,表示分类编码对象的顺序号。
表5-8 复合码的另一种形式示例
复合码的优点是:可较好地反映分类编码对象的层级,并且便于计算机求和。
复合码的缺点是:代码的总长度过长。当品名繁多时,很难直观地反映从属关系。
7.镶嵌式组合码
镶嵌式组合码是由相互独立的两部分代码镶嵌组合而成的,每一部分的代码长度都是变化的。其规律是一部分代码长度由小变大,而另一部分代码长度由大变小。这样,代码长度大小镶嵌,保证了镶嵌式组合码码长的恒定。
镶嵌式组合码的代码结构见图5-5。整个代码由A、B两部分组成。A由小到大,B由大到小,且A+B=N,其中N为一恒定数字。
图5-5 镶嵌式组合码结构图
镶嵌式组合码的优点是:大大节约了码位,节省了机器的存储空间。如果单独为A和B编码,代码长度分别需要A大和B大,否则不能充分反映A、B的情况。但是由于A、B两事物或概念间存在着相反的增长方向,如A大则B小,反之,B大则A小,所以利用A、B事物或概念间的这一客观规律,将A、B嵌合在一起,共同反映A和B的情况。这样,代码的长度只需要“A大+B小”或“A小+B大”就可以了。
镶嵌式组合码的缺点是:由于代码是由两个变化的代码部分组成,因
此,在编制代码时,要做好充分的调查研究,对编码对象的特性及其规律以及编码对象的最大量和最小量要做好充分估计。在此基础上确定组合码的总长度及镶嵌的结构,因此,代码编制较为复杂。
例如:中国标准书号中,出版社号+书序号就是8位的镶嵌式数字组合码。出版社号代码由2位→6位,书序号代码由6位→2位。其结构见图5-6。
图5-6 中国标准书号代码结构图
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。