5.3.2 机器可读目录(MARC)
MARC(Machine Readable Catalogue)是机器可读目录的简称,它是计算机能够识别和阅读的一种目录。MARC起源于美国国会图书馆于1965年1月提出的“标准机器可读目录记录款式的建议”(即MARC I)。在此基础上,1967年MARC II格式问世。此后,世界各国和地区相继采用MARC II格式建立本国和地区的机读目录系统。各国和地区的MARC格式除了在字段名称、字段标识符和数据内容上有差别外,其总体结构与MARC II格式是相似的。1971年美国标准局正式批准MARCII格式为美国国家标准。1973年国际标注化组织将MARC格式作为国际标准正式颁布,即USMARC格式,现改名为MARC21。
MARC格式伸缩性强,适应面广,具有如下的主要特点:①共包括001~999个字段,其中999字段为用户自定义的字段;②字段内容著录详尽,字段下又设子字段以及重复字段;③字段作用强化,可检索的字段多;④每条MARC记录可分为头标区、目次区、数据区。
下面看看几种典型的MARC标准。
①USMARC(美国国会图书馆机读目录通信格式)
USMARC的前身为MARC II格式,它完全与ISO2709规定一致,只在其字段标识和内容项目上不同。每条USMARC记录由头标区、目录区、数据区三部分组成。USMARC格式的主要字段有:目录控制区、主要款目(如个人作者、团体机关、会议或者集会、通用书名标目)、书名出版项、稽核项、丛书项、附注项、主题附加款目、其他附加款目(如个人姓名附加款目)、丛书附加等。
USMARC格式因广泛用于书目记录数据而被人们所熟知。1995年,随着美国国会图书馆负责的美国国家数字图书馆项目(National Digital Library Program,NDLP)——“美利坚回忆”(American Memory)的启动,USMARC格式被推荐为该项目所使用的几种元数据格式之一,并在该数字图书馆项目发展的过程中作了如下修改和规定:
a)增加“电子资源地址与存取”字段(Electronic Location and Access,即856字段),主要记录被著录的数字对象或与之相关的其他电子资源的存储地址和存取方式,为可重复字段(repeat-able),包含27个子字段。
b)增加部分“本馆用”字段以弥补不足。例如国会图书馆增加985字段作为记录每一数字对象的标识号的“本馆用”字段。
c)规定除头标、控制字段外,题名字段(245字段)、电子资源地址与存取字段(856字段)为必备字段。
d)建议尽可能使用责任者字段(1╳╳)、主题字段(6╳╳)、注释字段(5╳╳)。
②UNIMARC(国际机读目录通信格式)
该标准是国际图联IFLA于1976年为统一各国机读目录格式,在USMARC基础上主持制定的。1994年出版了《UNIMARC手册》第2版。UNIMARC实现了不同文种、不同载体的文献机读目录格式的一体化,为不同国家书目机构之间机读目录的交换创造了条件,推动了各国机读目录格式研制的修订。UNIMARC主要有如下特点:
a)UNIMARC将内容标识符标准化,克服了以往各国使用本国MARC系统中标识符的专指性。
b)编排字段不是按卡片目录的著录顺序,而是按字段的内在联系组织数据,并把相同性质的字段编排在一起,组成字段的功能块。
c)重视书目文献库中相关文献之间的关系,如平行关系、层次关系、从属关系。
UNIMARC是依据ISO2709-1973(E)和“英美编目条例”(AACRⅡ)等编目标准制定的,它将每条MARC记录分为0╳╳标识区、1╳╳代码信息区、2╳╳描述信息区、3╳╳注释区、4╳╳连接款目区、5╳╳相关题名区、6╳╳主题分析区、7╳╳责任者说明区、8╳╳为今后国际交流而设置的留用字段、9╳╳各国国内使用的字段。
③CNMARC(中国机读目录格式)
CNMARC是我国国家书目机构依据UNIMARC制定的《中国机读目录通信格式》(China MARC Format),作为中华人民共和国文化行业标准WH/ T0503-96推出,它与ISO2709的规定相一致,以UNIMARC为依据,凡UNIMARC中定义的字段适合于中国出版物的有关规定都予以保留,并补充了中国出版物特有而UNIMARC中所没有的字段定义。例如它增加了以下字段和子字段:
091统一书刊号;092订购号;093专利号;094标准号;690中国图书馆分类法;692中国科学院图书分类法;905馆藏信息。
一条CNMARC记录的结构如图5-1所示:
图5-1 CNMARC记录结构
其中记录头标由24个字符构成,含有关于记录结构的数据和为特定的形式而定义的几项数据元素,如记录类型、目录级别、记录完整程度和是否完全或部分采用ISBD规则。
地址目次区的结构如图5-2所示:
图5-2 地址目次区结构
地址目次区由三位数字表示的字段号、四位数字表示的字段长度和五位数字表示的字段起始字符位置构成。
数据字段的长度可变,每个字段之间由字段分隔符隔开。数据字段的结构根据字段号的不同有不同的结构。
下面是《格林童话》(格林兄弟著,蔡昌卓译,长江文艺出版社2007年版)这本图书在武汉大学图书馆书目检索系统中的MARC记录格式。
续表
这里采用的是CALIS联合目录CNMARC格式,与上例中相对应的字段如表5-1所示。
表5-1 CNMARC字段描述
续表
续表
续表
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。