首页 理论教育 以文献为计量单位的指数增长律的介绍

以文献为计量单位的指数增长律的介绍

时间:2023-11-04 理论教育 版权反馈
【摘要】:在所有关于信息增长的研究中,令人瞩目的成果是以文献为计量单位得到的指数增长律。因此,文献的指数增长定律具有一定程度的正确性和普遍性,并获得了学术界承认。需要指出,文献信息的指数增长规律是对每一年的文献累积数而言的,并不是相对于每一年新发表的文献数量。例如,勒希尔考察了不同质量级别的文献增长状况,发现它们的增长速度差别很大。勒希尔认为,文献的数量与其质量有关。

3.4.1 指数增长律

随着社会经济和科学技术的高度发展,信息的爆炸式增长不断影响着人们对信息的利用和吸收,描述信息的增长规律成为学术界和实际工作者关注的重要课题。在所有关于信息增长的研究中,令人瞩目的成果是以文献为计量单位得到的指数增长律。

(1)普赖斯曲线

早在1944年,F.赖德就对美国大学图书馆藏书作了调查统计,他以丰富的数据证明,全美主要大学图书馆的藏书平均每16年递增1倍。例如,耶鲁大学图书馆在18世纪初的藏书量为1 000册,如果每16年递增1倍,到1938年其藏书量应该增加到260万册,经调查,这一理论估值与实际藏书量十分接近。

继赖德之后,普赖斯对信息的爆炸式增长进行了深入研究。在《巴比伦以来的科学》一书中,他统计了期刊增长的情况:1665年在法国创办了第一本期刊,随后,1750年增加至10种,1800年增至100种,1850年为1 000种,1900年为10 000种,目前已近10万种,几乎是每50年增加10倍。其次,根据《化学文摘》、《生物学文摘》、《科学文摘》近几十年的数据,也可发现同样的增长趋势。如果我们以文献量为纵轴,以历史年代为横轴,把各不同年代的文献量在坐标图上逐点描绘出来,然后以一光滑曲线连接各点,则可十分近似地表征文献随时间增长的规律。这就是著名的普赖斯曲线,如图3-5所示。

通过对曲线分析,普赖斯最先注意到文献增长与时间成指数函数关系。如果用F(t)表示时刻t的文献量,则指数定律可表为:

img83

图3-5 普赖斯曲线

F(t)=aebt      (3-22)

式中,a是统计的初始时刻(t=0)的文献量;

e=2.718;

b表示持续增长率。

人们还常常用文献量翻一倍的时间来衡量文献的增长速度,即:

t'=ln2/b      (3-23)

式中,t'为文献量翻倍时间,b为持续增长率。

例如,在某一初始时刻,文献量a=10 000件,增长率为10%,那么10年后文献量将是:

F(10)=10 000e0.1(10)=27 183(件)

100年以后的文献量将是:

F(100)=10 000e0.1(100)=220 264 660(件)

文献量翻一倍的时间是

t'=ln2/0.1=0.693/0.1=6.93(年)

从统计实例来看,文献信息的指数增长规律在一定程度上正确反映了文献的实际增长情况。例如,对1952—1982年世界图书增长情况的统计分析表明,图书种数大约每20年翻一倍,指数增长模型与实际情况符合得较好。又如,对1907—1977年世界化学论文数量进行统计,由指数模型计算的值与实际情况大体一致,说明这一时期的化学论文数量也是按指数增长的,大约每10年翻一倍。因此,文献的指数增长定律具有一定程度的正确性和普遍性,并获得了学术界承认。

文献信息(或者信息)指数增长的内在原因是由于社会信息流的传播和影响的结果。在一个健全的社会信息交流系统中,那些业已掌握新思想、新信息的成员,必然主动或被动地影响其他社会成员。人们接受新思想、新信息的概率会随着时间的推移而增大。因为这与掌握新思想的累积人数有关。这些掌握新思想和新信息的人数本身是按指数增加的,他们必然要从事知识信息的生产和传播,这就必然引致信息量指数增长。如果一个人接受新思想、新信息的概率随时间按固定比例增大,则有:

img84

解此方程得:

img85

令ec=a,则N=aebt,正好与(3-22)式相同。

需要指出,文献信息的指数增长规律是对每一年的文献累积数而言的,并不是相对于每一年新发表的文献数量。每年文献信息的累积数,就是该年与该年之前各年(至少是统计的各年)文献数量之和,即该年可以利用的文献总量。如果不考虑累积量,结论可能完全不一样。如果按每年发表的文献来判断文献信息的增长规律,它可能连几何性都不是,而仅仅是算术性的。

文献信息的增长律仅仅是一个理想模式,它没有考虑到许多复杂因素对文献增长的限制。如果不考虑这些因素,简单搬用(3-22)式来预测未来的文献量,可能会导致错误的结论。实际的统计发现,不同时期、不同级别、不同质量、不同学科领域的文献信息增长态势是不一样的。例如,勒希尔考察了不同质量级别的文献增长状况,发现它们的增长速度差别很大。

勒希尔认为,文献的数量与其质量有关。他定义A(0≤λ≤1)为文献的质量级别,则不同级别上的文献量为[F(t)]λ。他给A的具体值如下:

λ=1:至少是一般文献(实际代表所有文献)

λ=3/4:至少是有意义的文献

λ=1/2:至少是重要的文献

λ=1/4:至少是非常重要的文献

λ=0:第一流的文献对于第一流的文献(即λ=0),文献数量为InF(t)。如果文献总数为100万件,根据勒希尔定义的质量级别,则有:

1 000 000:至少是一般文献(即文献总数)

31 623:至少是有意义的文献

1 000:至少是重要的文献

32:至少是非常重要的文献

14:第一流的文献

如果文献量翻倍时间为t',那么质量为A级的文献数量翻倍时间将是t'/λ。于是当人们力图提高文献质量时,指数增长减慢,对于第一流的文献(λ=0),指数增长规律完全破坏,并且每一周期仅有一常数增量。在这种情况下,文献的增长函数是线性的,即:

F0(t)=lnaebt=lna+bt

在本节开始所举的例子中,b=0.1,文献总量翻一倍的时间为6.93年,那么对各个质量级别的文献而言,文献量对应的翻倍时间是:

9.84年:至少是有意义的文献(λ=3/4)

13.86年:至少是重要的文献(λ=1)

27.72年:至少是非常重要的文献(λ=1/4)

对于第一流的文献(λ=0):

F0(t)=ln 10000+0.1t

可见,每10年才增加1份第一流的文献。这样的增长速度显然非常缓慢。

(2)生长曲线

普赖斯指出,考虑物质的、经济的、智力的及时间的影响和限制,文献信息的增长更趋近于生物的生长曲线(Logistic Curve),即最初生长或繁殖很快,随着时间推移,其生长速度越来越慢,以致几乎不增加了。其方程为:

img86

式中,F(t)代表时刻t的文献量,k为文献增长的最大值。

图3-6的生长曲线表明,在文献增长的初始阶段,它是符合指数增长规律的,但它不能始终保持指数增长的势头,当文献增至最大值的一半时,增长率开始变小,最后缓慢增长,并以k为其极限。

生长曲线在描述科学文献增长规律时,取得了一定成功。如果单独就某一具体学科领域内文献的增长而言,生长曲线极好地描述了它们的增长规律。例如,弗雷蒙等人对1965—1975年煤的气化法方面的文献增长进行了统计研究,表明能很好地符合生长曲线增长模型。有关肥大细胞研究方面的文献增长所出现的几个发展阶段更有力地证明了生长曲线增长规律的正确性。

img87

图3-6 生长曲线

在整个科学领域里,目前约有2 000门学科,每门学科又分别处于诞生、发展、相对成熟的历史阶段。一般来说,在不同的阶段科学文献增长的态势是不同的。统计研究表明:学科处于诞生和发展阶段,文献量指数增长,文献的寿命较短。随着研究深入,学科进入相对成熟阶段,文献增长就不能总保持原有的指数速率,增长率变小,曲线变得平缓,文献寿命相对变长。但是,这里文献增长率变小,决不意味着科学发展停滞,而是某一知识领域的研究取得重大进展后进入相对成熟的阶段。同时,也可能意味着该知识领域正面临新的突破,将产生出更新的分支领域,而内容上更新的文献又将进入一个新的急剧增长时期(如指数增长)。然后又进入一个稳定时期。文献的增长往往会出现几个急剧增长时期和几个相对稳定时期,呈现出错综复杂的格局。

一般说来,对不同的领域,描述其文献增长的生长曲线中各个常数(a,b和k)是不相同的。如果能分别对各门具体学科文献增长状况作历史的、全面的统计分析,绘制出相应的生长曲线,则对于评价该门学科所处的阶段,预测其未来的发展,估计该学科不同时期的文献寿命,以指导信息搜集和提供,是很有意义的。

但生长曲线仍有其局限,由(3-24)式可知,当t→+∞时,F(t)→k这表明当科学发展到一定阶段时,文献的增长率为零,而文献总量达到了不可逾越的最大值。这意味着某个年代之后,再也没有新的文献产生,这显然是不符合实际的。

利用指数曲线和生长曲线来研究文献增长、预测未来文献总量必然会有局限。这是因为:①指数增长定律的产生,首先是普赖斯分析研究物理学文献数量的增长时提出的,然后把这一结果扩大到科学期刊和其他类型的出版物上,绘制了普赖斯曲线。把对文献某一方面、某一历史阶段的研究成果,推广到文献的全部领域,根据是不充分的。②利用上述二曲线对文献增长所作的预测,依据的是预测学中的趋势外推法。文献作为传播信息这一复杂系统中的子系统,其增长规律受到许多因素的影响和制约,只有利用系统论的观点对其作系统分析,才能得到比较符合实际的结果。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈