科技文献是记载科技知识或科技信息的物质载体,全世界的科技成果都是通过文献来传播的,因此,科技文献是正式渠道的信息交流中非常重要的信息源。无论是科技情报学或是其应用实践的科技文献检索,其研究对象都是科技文献。在本节中,将对科技文献资源作多角度的了解。
在绪论一章中已了解了信息、情报和知识之间的逻辑关系。正如计算机信息处理的实质是情报处理一样,人们的许多活动都是广义的情报活动。例如,通过教学,老师把知识和技能传授给学生,教学就是一种规范化的情报活动。记住一个基本概念:
情报,就是紧紧围绕着人进行的信息的交流和传播。
下面将讨论信息资源和文献资源的各种划分。
2.1.1 什么是信息资源
信息资源(information resources)也称为文献信息资源或文献资源,指可供利用并产生效益的与社会生产和生活有关的各种文字、数据、音像、图表、语言等一切信息的总称。
美国哈佛大学的研究小组曾给出了著名的资源三角形,如图2.1所示。他们指出:没有物质,什么都不存在;没有能量,什么都不会发生;没有信息,则任何事物都没有意义。
图2.1 资源三角形
作为资源,物质为人们提供了各种各样的材料;能量提供各种各样的动力;信息提供各种各样的知识。虽然信息普遍存在,但并非所有的信息都是资源,只有满足一定条件的信息才能构成资源。对于信息资源的理解通常包括两个层次:从狭义上理解,认为信息资源是人类社会活动中经过加工、处理并大量积累起来的有用信息的集合,一般指信息本身;广义的理解,则认为信息资源是信息活动中各种要素的集合,即不仅包括信息本身,还包括信息设备设施、信息人员、信息技术、信息系统等。
应当说,狭义的信息资源反映了信息资源的核心和实质,而广义的信息资源更符合信息活动的实际,有利于充分地发挥信息资源的作用。
归纳起来可认为,信息资源由信息生产者、信息、信息技术3大要素组成。
信息资源构成三要素如下:
(1)信息生产者
信息生产者是为了某种目的生产信息的劳动者,包括原始信息生产者、信息加工者或信息再生产者。
(2)信息
信息既是信息生产的原料,也是产品。它是信息生产者的劳动成果,对社会各种活动直接产生效用,是信息资源的目标要素。
(3)信息技术
信息技术是能够延长或扩展人的信息能力的各种技术的总称,是对声音、图像、文字等数据和各种传感信号的信息进行收集、加工、存储、传递和利用的技术。信息技术作为生产工具,对信息收集、加工、存储和传递提供支持与保障。
2.1.2 信息资源的类型划分
信息资源按传播渠道,可分为文献信息(文献信息资源)和非文献信息资源(口语、体语和实物信息资源);按照物质载体,可分为印刷型、视听型、缩微型和电子信息、网络型资源;按不同的内容加工深度和层次,可分为一次、二次和三次信息资源;按照文献的出版类型划分,可大致分为“十大情报源”。
其他还有按应用领域,将信息划分为工业信息、农业信息、军事信息、政治信息、管理信息等;按传播范围的受控程度,可将信息源分为公开、半公开、非公开信息资源;按信息的作用层次,可分为战略信息资源和战术信息资源;从信息的结构出发,可将信息划分为语法信息、语义信息和语用信息。
人们在收集文献信息时,应首先选择本专业的核心期刊。所谓核心期刊,比较一致的定义是:在某一学科中,少数期刊覆盖了该学科的大部分最有参考价值的文献,而多数期刊仅包含该学科的少量最有参考价值的文献,这少数期刊就是该学科的核心期刊,它集中了学术研究的前沿信息,是必不可少的文献信息源。
当然最有效地全面阅读这一专题文献的方法,是通过检索工具进行检索,得到命中文献的线索后找到原文进行研读。
确认所需学科国内外核心期刊的常用工具书有《中文核心期刊要目总览》和《国外科技核心期刊手册》。另外,《世界图书》杂志也常常发表国外核心期刊的研究结果。下面详述几种主要的文献信息资源类型。
2.1.3 信息资源的4种传播形式——按传播渠道划分
(1)口传情报
口传情报指交谈、讨论、报告、新闻发布会等。此类交流的方式一般有:同行交谈、讨论;书信交换;各种类型的学术会议;参观实验室;参观科技展览会,等等。
口传情报的文献级别是构成零次文献,有时是半文献。特点是速度快、直接、高度的选择性、针对性。如各种学术会议上宣读的论文和报告,常将某专业技术发展的新水平、新技术、新工艺、新观点、新设想等快速传播出来。其缺点是极不稳定,信息稍纵即逝。
在《钢铁是怎样炼成的》一书中有一个小场面,保尔·柯察金病愈后到其哥哥阿尔青家的乡下休假,有一天他正在村里散步时,听见两个正在家门口晒太阳的老太婆小声议论:
“瞧,打哪儿钻出来这么个可怕的家伙。”
“那可不,简直是刚从坟墓里爬出来的。”
“可是你看他身上那件崭新的皮衣——”
“多半是偷来的吧……”
柯察金气愤地走开了。
在四川农村,常常能看见如下场面:
妇女甲:qu-qu-qu-qu(耳语)
妇女乙:啧-啧-啧-啧(小声,作惊叹状)
妇女甲:qu-qu-qu-qu(耳语)
妇女乙:哎呀,我的天……该死的!(大声)
(2)体语情报
体语,即人体语言,它指人们通过表情、姿势、动作、语气、手语等非词语途径表达的内心信息。眼睛是人的心灵窗户,能够反映人的内心,因此,目光接触是一种打开对方心扉的有效交流手段,一个真诚的目光注视,胜过千言万语;姿势作为一种非语言符号,用来表达思想感情简单明了,如一个“不要出声”的手势就可以让人们在影院大厅里安静下来,“此时无声胜有声”;微笑,更是特具魅力的杀手利器,尤其是带有笑意的目光,简直无人能够招架。此外,一个人的服饰装扮、行为举止也是一种无形的形象语言,体现了人的端庄大方和气质。
美国心理学家赫尔认为,人际空间距离的使用与人的某种本能有关,这是把自己的存在告知他人以及感知他人远近的一种本能。一般可分为4种类型:亲密距离为0.4~0.6 m,个人距离0.6~1.5 m,社会距离1.5~4 m,公众距离4~8 m或以上。
(3)实物情报
实物情报是指产品样机、样品、展览交流。特点是真实、直观、易仿制,同引进技术相比花钱少。缺点是要经过复杂的分析和研究才能解析出来,如我国最早的DJS 130小型计算机就是仿制日本的NOWA机、历时8年研制出来的。
(4)文献情报
文献情报是用文字、图形、符号、声频、视频等手段记录在一定的物质载体上的知识含量较高的信息。这是一种在空间和时间上积累和传递情报的最有效的手段。
文献情报是最基本、最重要的情报源。它们也是正规渠道传播的情报源。
实物情报过于“稳定”,口传情报太易“挥发”,体语情报太“情绪化”,它们都稍纵即逝,只有文献情报十分稳定,而且又是最容易复制的。实物情报相当于“硬件”,文献情报则相当于“软件”。口传和体语情报的信息,消息成分太多,而知识含量太少,不能构成“软件”。
以下的划分均以文献情报作为对象。而口传情报、体语情报和实物情报由于不是“主角”而退场了。
2.1.4 文献资源的形式——按文献的载体形式划分
根据文献的物质形式,全部文献被划分为6大类。文献似乎天生就是为了被复制而存在的,因此我们对每一种类型的文献,都顺便提一下它的复制手段或复制设备,看看它们各有什么不同。
(1)印刷型文献(print form)
用途最广,便于阅读、流传、符合人们的阅读习惯,缺点是存储信息密度较低,保藏和管理需要很大的空间和人力。
这是以纸张为存储介质,以印刷、复印等为记录手段的传统的文献形式。印刷型文献包括油印、石印、铅印、胶印等。这是至今为止一直占据着主导地位的一大类,而且将来也不会被淘汰,但其价格将越来越高,因为造纸的主要原材料(木材)会越来越少。印刷型文献用复印机复制,(对于卡片式文献可用卡片复印机)。这是小规模的复制,而印刷厂则为大规模的复制。
(2)缩微型文献(micro form)
这是以感光材料为存储介质、以缩微照相为记录手段而产生的文献形式,它包括缩微平片(microfiche)、缩微胶卷(microfilm)等,比印刷型的体积小、存储密度高,但查阅时需专门的阅读器。
(3)电子出版物(electronic publications)
电子出版物也称“电子型”文献,即早期所谓机读型文献,指通过计算机存储和阅读的文献类型。它是以磁性或塑性材料为载体,以穿孔或电磁、光学字符为记录手段,通过编码和程序设计,将文字语言变成计算机可以识别的机器语言,输入计算机,阅读时再由计算机将其内容输出。它主要包括磁带、磁盘、光盘,以及种类繁多的电子出版物,如电子图书、电子期刊、电子报纸,等等。电子出版物的复制一般采用计算机拷贝文件的方法。在互联网上经常使用的“download(下载)”或“上传(upload)”“灌水”等,实质仍然是“网上拷贝”。
(4)声像型文献(audio-visual form)
声像型文献以磁性材料或感光材料为载体,以磁记录或光学技术为记录手段直接记录声音、视频图像。它也称视听资料或直感资料。这一类文献有唱片、录音带、录像带(港台称“录影带”)、科技电影、幻灯片等。优点是直观、生动、栩栩如生,但成本较高而且不易检索和更新。图书馆一般也设置有专门的视听阅览室用来播放或复制这类文献。
通常用高速摄影拍摄那些变化快的过程,如原子核的裂变,而用慢拍或间歇拍如零件磨损、植物发芽、星空的变化等,再用常速播放。其原理利用了人眼视觉暂留现象(约100 ms)。声像型文献的复制用录音机和录像机等设备。
(5)光盘型文献(CD-ROM form)
这是一种以弱激光束记录和再现信息的“海量”存储型文献。光盘技术是激光技术、唱片制造技术、高密度存储技术和计算机技术结合的产物。光盘大致分两大类:一种是信息编码为模拟式的录像光盘或激光电视唱片,它同录像带一样可快进、快倒或静止,适于作图像的存档和检索;另一类为数字化的高密度光盘CD-ROM(Compact Disc Read-Only Memory),它是通过激光束使光盘上产生槽或起泡来记录或读出信息的。还有一种仅仅使其表面介质材料性质发生相变而本身并不变形的数字化光盘,这就是可擦除型光盘。一张CD-ROM盘直径4.7 in(1 in=2.54 cm),可存储10年的人民日报的全部信息,或大英百科全书整套30卷的内容。
光盘型文献不但是“海量”存储介质,而且由于读写头不与介质直接接触,因此使用寿命理论上至少可达10年以上。常见的光盘都是只读的,个人复制可将其拷贝到硬盘上,或设置虚拟光驱,或用光盘刻录机。厂家复制生产需要先制作母盘,这样成本很高,但如果数量很大,则一张光盘的成本可能远低于软盘片。这与图书的出版、印刷特点有些类似。
(6)网络型文献(network form)
网络型文献主要指互联网上的所有机读文献。网络型文献的载体是网络,而机读型文献的载体是磁盘或计算机,这是它们的最大区别。
在上述6种文献载体中,网络型文献的本质仍然属于机读型;光盘型尽管也有“缩微”、可作为声像存储等特点,但它的实质也仍然是机读型。
为什么文字或字符在网上的传输比图像快得多?
因为字符实际上只传输其ASCII码,而图像则必须发送每一个像素。例如发送字母a,只需要1个字节的ASCII码8个位,但如果将a的点阵发送,则需要7×9=63个位;发送1个汉字,需要2个字节16个位,但若将其字模点阵发送,则需要16×16=256个位(汉字国标码的最小的字模点阵,即显示字库)。
发送63个位的a字符的点阵所受到传输干扰可能较大,但发送其ASCII码则干扰几乎为0,甚至解析度更高都有可能,只需接收方调用更高解析度的字模点阵即可。这就是数字传输的高可靠性和抗干扰性极佳的原因。
当然,除了印刷型之外,其他几种都在迅速发展,并将在信息高速公路中“一展身手”。而相伴人类达几千年之久的印刷型文献,无论在漫长的岁月里,或是在高科技的今天均未被淘汰,而且也在发展(如激光照排缩短了文献的出版周期),仍为文献的主流,这说明它自有其存在的价值和发展的动力。可能是专门的载体(纸张)和专门的媒体(以文字为主)加上最好的人机工程学特点,以及年代久远等因素构成印刷型文献不易被彻底取代的根本原因。
讨论题目:是否在21世纪真的会淘汰印刷型文献,进入一个史无前例的“无纸化社会”?
例如,重庆大学图书馆收藏有1931年的美国《工程索引》,现在看起来还几乎像新的。
事实上全人类经过多年的“寻寻觅觅”找到的纸质书本式文献也许是最好的,不会被任何其他材料所完全代替。例如,微机的发展中,体积和质量越做越小,笔记本电脑只有16开书本大小,掌上型只有袖珍收音机一般大。但当前使用最广的台式(卧式或立式)微机将永远不会被只适合特殊用途的笔记本式或掌上型所替代。
因为是按文献的载体进行分类,所以还应有一类“手写型文献”,即书信、笔记、会议纪要、原始手稿等。它们的特点是一般未经印刷或出版过。这类文献往往具有重要的馆藏价值甚至可能价值连城。不过本书不将它列为正式的类型。
2.1.5 科技文献的级别——按文献被加工处理的深度划分
科技文献按对其加工处理的深度区分,产生所谓一、二、三次文献的概念。
(1)一次文献(primary document)
一次文献通常指由作者以自己的研究成果为基础创作或撰写的文献,如期刊论文、科技报告、专利说明书、会议论文及学位论文等。它们通常或多或少包含着著者的创见。这是对知识的第一次加工(创造性)。
(2)二次文献(secondary document)
二次文献是指文献工作者将大量分散的、无序的原始文献加以筛选,留下有价值的文献,再经过加工整理,或按文献的内容特征(如主题、分类),或按文献的外部特征(如著者、篇名等),进行提炼、浓缩、简化,编辑成系统的工具性文献,如文摘、索引、书目等检索工具,专为查找原文之用。这是对知识的第二次加工(有序化)。
(3)三次文献(tertiary document)
三次文献是指利用二次文献系统地检索出一批有关的文献,并对其运用科学方法和专业知识进行深入研究后撰写出的新的文献。它们可以是书(专著)或期刊论文等,与一次文献非常相像,但又不同于一次文献。三次文献可再分为以下两种形式:
①文献型(又称知识浓缩型),如综述、述评、专著之类。
②数据型,如字典、词典、数据手册、百科全书等。
三次文献是对知识的再加工(第三次加工)。其中:
①主要供作文献检索(这是特殊的一类检索对象,其所含信息和知识都较为密集。可用美国科学信息所的《科学评论索引》ISR专门检索评论和综述类文献)。
②主要提供数据、事实检索,二者之中,文献型为三次文献的主要代表。顺便提一下,有的书将检索工具指南或“目录的目录”也作为三次文献中的一种,其实尽管是“目录的目录”,似乎颇具三次文献的特征,但实质上仍然没有超过检索工具、二次文献的意义。
这里可用“趋势外推法”来判别一下。假如“目录的目录”是三次文献,那么对“目录的目录的目录”是否能定为四次文献呢?
从文献情报的角度看,一次文献是检索对象(目标)、二次文献是检索工具(手段)、三次文献是情报研究成果(既可作为检索目标,又可作为检索手段)。
从人的社会分工情况看,一次文献的生产者是广大的作者(包括出版社编辑人员);二次文献是图书、情报工作者的产品;三次文献则一般是那些既懂专业又熟悉本专业情报的专家的研究成果。
从哲学、社会学角度看,一次文献是知识积累和社会进步的主要基石(知识宝库);二次文献是使人类知识得到充分利用的工具(知识宝库的钥匙);三次文献却是在更高层次上系统地再现一次文献(知识宝库的金钥匙)并返回到一次文献,完成一个又一个知识的社会循环。
从一次文献到三次文献再回归到一次文献,正是自然辩证法中一个重要定律:否定之否定定律。同时也正是科技文献生生不息,蓬勃发展的链式结构中重要的一环。
从知识加工的角度看,一次文献是对知识的第一次加工(创造性),二次文献是对知识的第二次加工(有序化),三次文献是对知识的再加工,它既是有序化的,又带有一定的创造性,并常常在形式上也返回到一次文献(如专著、综述文章等)。
从一次文献到二次文献、三次文献是一个由博到约、由分散到集中、由无序到有序、再由有序到有机的结构化、系统化的过程(在这个过程中信息熵逐渐减少)。
除了一、二、三次文献的概念外,还有0次文献和半文献的说法。所谓0次文献(zero document),是指通过交谈或听报告之类所得到的情报,它们通常未经记载或仅仅是一些零乱的笔记。半文献(half document)又称灰色文献(gray document),是指非公开出版的内部文献,它们往往是通过正规售书途径得不到的资料(交换或赠送)。不过这两种级别的文献只能构成非正式渠道的情报交流,在文献检索中的作用微乎其微。
此外,还可按照文献内容的社会公开程度来划分文献的世界。
2.1.6 白色文献、灰色文献和黑色文献——按内容的公开程度划分
所谓白色文献,是指一切正式出版并在社会上公开流通的文献,包括图书、报纸、期刊等。这类文献通过出版社、书店、邮局等正规渠道发行,向社会所有成员公开,其蕴涵的信息大白于天下,人人均可利用。
灰色文献是指非公开发行的内部文献或限制流通的文献,包括社会公开传播的内部刊物、内部技术报告、内部教材和会议资料等。这类文献出版量小、发行渠道复杂、流通范围有一定限制,不易收集。
黑色文献主要是指处于保密状态或涉及个人隐私内容的文献,如未解密的政府文件、单位内部档案、个人日记、私人信件等。这类文献除作者以及特定人员外一般人极难获得和利用。
2.1.7 十大文献信息源——按科技文献的出版类型划分
(1)科技图书(books)——一次文献、但又含有三次文献的性质
科技图书的范围很广,包括从艰深的专著到各类教科书和科普读物等。它的特点是内容系统、全面、成熟、可靠。科技图书中既有一次文献(如专著),又有三次文献(如评论文集),还有二次文献(如书本式检索目录)。但从整体上说,科技图书应是一次文献,但又带着三次文献的性质。图书的缺点是出版周期长,报道速度慢。如果想对范围较广的问题获得一般性了解,或对陌生的问题作初步学习(如想了解人工智能方面),阅读图书是一个好办法。
现在的书都一定有个ISBN号,即国际标准书号(International Standard Book Nomber),其定长为13个数字。不要小看这13个数字的组合,它采用弹性存储方法(可变长存储技术),可把全世界的书都管理起来。让我们看看它的存储机制。以下以《计算机网络基本原理》一书的书号为例。
ISBN 7①-5609②-2141③-8④
①地域号 ②出版社号 ③书号 ④计算机校验位
ISBN号为定长13位,前面加上ISBN的标识,13位数字又分为4个部分:①是地域号(代表国家、地区、语言区),如7指中国、0和1指英语国家、2指法语区(如法国和加拿大法语区)、3指德语区(如瑞士德语区)、4日语、5苏联、88意大利、9971新加坡等;②是出版社号;③是书号;④是计算机校验位。ISBN号前3部分都是变长结构,但总长不变。根据ISO有关标准,计算机校验位是用前9位数字分别对10,9,8,…2的乘积之和,对11的模数求余,再用模(11)减去余数而得。如此例:
因此该书号的校验位是8。一个数对11的模求余,可能的余数集合是0,1,2,…,10,当余数为10时,为了保证全长13位,于是用大写字母X表示。
但中国的ISBN号却还要在国际ISBN号后面加上中图法的大类号和小类号,如此例为: ISBN 7-5609-2141-8/TP·365。“TP”即为中图法的大类号(自动化及计算机),365则指计算机网络类。
小小的ISBN号实现了对全世界图书的管理,不能说不是一个奇迹。它采用动态信息存储原理,便于对图书进行分层管理。例如,国际ISBN中心负责管理世界各第地区或国家号,各国则对自己的出版社号进行管理,各出版社再对其分配的书号进行管理。
(2)连续性出版物(serials)
1)期刊(periodical)——最典型的一次文献
期刊指定期或不定期出版的有固定名称的连续性出版物。它们有连续的卷期或年月顺序号,具有周期短、反映新成果及时、内容新、信息量大等特点。据统计,文献需求的68%为期刊论文,期刊文献的利用约占科技文献总量的80%。期刊属于周期性出版物、具有品种多、数量大、报道速度快、内容新颖,能及时反映当前科技水平等特点。科技期刊是一次文献,是人们传递科技信息、交流学术思想使用的最基本、最广泛的手段,也是我们课程检索的重点。
连续性和周期性以及报道专题的多样化是期刊最显著的特征。期刊(journal)和杂志(magazine)这两个不同的说法,一个强调前者,一个强调后者,但都是指同一回事。期刊的外部文献特征的特点是:刊名和编辑单位一般不变;定期出版、连续出版,并多数为月刊;有固定名称和连续性编号,如年、卷、期号;一般不再版、也不重印。常见的周期如monthly(月刊)、weekly(周刊)、bimonthly(双月刊)、quarterly(季刊)、annuals(年刊)等。
期刊还有级别,这是根据其学术水平和编辑部资格等标准综合评定的。分市、省、全国、国际等级别。以通报(Bulletin)、学报(Acta)为名的期刊多是由大学或学术团体出版的,学术水平较高。Transaction(汇刊)同此,例如,IEE的系列汇刊是国际电气电子学界的权威刊物。
有一个世界著名儿童故事跟我们的期刊的连续性特点曾经发生过一点小小“邂逅”。这故事叫“爱丽丝漫游奇境记”——一个美丽的童话故事,作者署名卡罗尔。但谁也没想它竟出自英国皇家科学院一个数学家之手,包括作者的同事。据说当年维多利亚女王读了《爱丽丝》后非常喜欢,立即命令她的手下前去搜罗这位故事高手的其他作品,没想到带回来的却是厚厚几本艰涩难读的数学著作,署名是道基森(Charles Lutwidge Dodgson)而不是卡罗尔。女王勃然大怒,几乎将手下问斩。后经多方调查,最后才不得不相信,这位著作甚丰的牛津大学数学教授,暗地里却是一位童话故事高手,而且写的童话故事,成人也大多喜欢。
期刊中也有一种连续性会议录,它们多是每年在不同的地方召开的国际会议的结果。为了包括所有的这类出版物,期刊获得一个较全面、正式的名称,称为“连续性出版物”。
同图书一样,期刊等也有国际标准连续性出版物编号ISSN(International Series Standard Number),实现对全世界期刊文献的管理。ISSN号全长8位,前7位是刊物代号,末位是计算机校验位(算法同ISBN,模仍用11,只是加权数用8,7,…,2,这7个数)。注意如ISSN 1000-0402(这是《图书馆学通信》期刊的号),中间的“-”只是为了便于阅读而设置的。计算机校验位的求出,例如:
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。