首页 理论教育 以数学为基础的若干高技术

以数学为基础的若干高技术

时间:2023-02-13 理论教育 版权反馈
【摘要】:计算机技术与数学技术几乎无法分开,它们几乎是同一的。微电子技术的最基础技术的印刷电路板制造就是一个货郎问题。①信息获取技术这是把含有所需信息的数据检测出来的方法。信息技术是以数学为基础、数学含量最高的高技术。维纳在更为广泛的高度上提出了信息概念。而今天为信息安全的加密技术要求把一个大的整数分解成两个奇数的因子,并要认识如何分解的。

以数学为基础的若干高技术

计算机技术与数学技术几乎无法分开,它们几乎是同一的。计算机技术本质上是数学技术。其实,以数学为基础的高技术还有许多。今只择其中几个略作介绍。

(1)微电子技术

是指采用计算机辅助设计将数万、数百万晶体构成功能电路,将图形微缩至毫米级甚至微米级的面积,应用微缩掩膜,采用微米和厘微米光刻及腐蚀加工技术,在中导体单晶芯片上制成微型电路的整套技术,以及用这些电路装备成各类微电子设备的总称。微电子技术对信息技术、自动化技术、机电一体化等都有重大影响,是高技术发展的重要领域。自20世纪60年代初制成第一块集成电路以来,微电子技术逐步形成,之后,由于其功能优异、价格低廉,在20世纪70—80年代得到迅速发展。以存储器为例,从1970年至1983年,集成度提高1 000倍,单位价格只有原价格的2.5‰。微电子技术出现后,微处理器(微型计算机的运算和控制部分)等应运而生,大大推动了计算机在各行各业的应用。该技术还引起了许多商品结构的变化,如电子钟表、袖珍计算机、家用微型计算机、收录机、数字式电话交换机以及各行各业的自动化装备等等。

微电子技术的发展,数学是立下了大功的。

首先,微电子的基础是逻辑代数,这是大家已知的;其次,得益于“货郎问题”的逐步被征服。最初的货郎问题是指一个城市,一位货郎打算从这座城市进出一次,走哪条路最短?这是一个古老的问题。看起来问题并不难,只要列出所有的路线,比较后,即可找到最短路线。其实不然,如果城市到100个,所有路线则是100的阶乘,大约与10的210次方的大数相当。比较如此之多的路线实际上是不可能的,这就是货郎问题的困难之处。对现代工业来说,100座城市的货郎问题还是小问题。微电子技术的最基础技术的印刷电路板制造就是一个货郎问题。人们用微光束在电路板上打数十万甚至数百万个孔,激光束是固定的,而电路是运动的,电路板如何动作才能使激光束走的路线最短?这就是几十万甚至上百万个城市的货郎问题。现在由于数学家们逐步征服了这个问题,解决了这个关键技术问题,才使微电子技术有如此神速的进步!

(2)信息技术

应用信息科学的原理和方法研究信息的产生、获取、交换、传输、存储、处理和利用的工程技术,称为信息技术,又称信息工程。信息技术是在计算机、通信和微电子技术、控制技术的基础上发展起来的。信息技术的研究对象是各种信息系统的实现技术,主要是运用“三C”(计算机、通信、控制的英文的第一个字母)来构成各种信息系统。信息技术包括信息获取技术和信息传输技术。

①信息获取技术这是把含有所需信息的数据检测出来的方法。采用的设备有各种传感器、打印机和键盘,以及各种语言、符号、文字、图形的识别装置。

②信息传输技术利用通信系统在各用户之间传输信息。用通信系统把分散的数据库和计算机设备联成一体,可使广大用户计算机按一定目的以一定的方式进行加工处理。

信息技术是以数学为基础、数学含量最高的高技术。哈特莱(L.P.Hartlry,1895—1972,英国数学家)首先提出,用对数作为信息量的测度。这样,信息就可以用数学方法从数量上加以测量。接着,哈特莱又在1928年发表《信息的传输》,首次提出了消息是代码、符号,它与信息有区别(消息是信息的载体,消息的形式是多样的、具体的,如各种语言、文字、图像等,而信息是指包含在各种具体消息中的抽象量)。他具体区分了消息和信息在概念上的差异,并提出了用消息出现的概率的对数来度量其中包含的信息。接着是申农(C.E.Shannon,1916年生,美国数学家)发表了著名论文《通信的数学理论》及1949年的《在噪声中的通信》。当时申农在著名的贝尔电话公司工作,在研究过程中,他为了解决信息的编码问题,为了提高通信系统的效率和可靠性,需要对信息进行数学处理,这就要求合并通信系统中消息的具体内容(如信息的语义),把信源发生的信息仅仅看作一个抽象的量。同时,由于通信的对象——信息具有随机性的特点,因此申农还提出了通信系统模型以及编码定理等方面有关的信息理论问题。他还把数理统计方法应用到通信领域,并提出了信息熵的数学公式,从量的方面来描述了信息的传输和提取问题。

20世纪40年代,通信工作中所遇到的一个突出问题,就是怎样从收到的信号中把各种噪声滤除,以及在控制火炮射击的随动系统中如何跟踪一个具有机动性的活动目标。而各种噪声的瞬时或火炮的跟踪目标位置的有关信息都是随机的,这就要求用概率和统计法对它进行研究,用统计模型进行处理。维纳(R.Wiener,1894—1964,美国数学家)从控制和通信的角度研究了信息问题,建立了维纳的滤波理论(即从获得的信息与干扰中尽可能地滤除干扰,分离出所期望的信息),维纳还提出了信息量的概念、测量信息量的数学公式,叙述了信息概念形成的思想前提,并把信息概念推广,认为信息不仅仅是通信领域研究的对象,而且与控制系统有密切联系。维纳正是抓住了通信与控制系统的共同特点,站在一个更为概括的理论高度,揭示了它们共同的本质。维纳在更为广泛的高度上提出了信息概念。由于对信息量可以用概率和统计的方法进行计算,因此,就能够求出各种通信系统的信息传输率,对它们进行分析比较,从而对它们的通信性能作出评价,以改进和提高信息的传输能力和可靠性;同时,对各种不同形式的信息,可以用统一的通信理论(即数学理论),从量的观点去设计它们的传输系统,从而解决了同一信息可以用不同的信道进行传输,不同信息可用同一信道传输的问题;还可以把不同类型的系统,如技术系统、生物系统、管理系统看作是对信息的获取、传递、加工、处理的信息调节控制系统,统一进行研究,不仅促进了信息理论研究,更推动了信息技术更加成熟。

信息技术中还有一项是非常重要的,即信息的安全性。要解决这个问题仍然要依靠数学。数学的研究形式以及考虑问题的方法,在新的21世纪应有很大变化。由于技术进步和实际要求不同,在过去认为没有考虑价值的问题,今天却成了不得不考虑并解决的重大问题。如因子分解,过去认为只要证明唯一分解成几个素数乘积即可。而今天为信息安全的加密技术要求把一个大的整数分解成两个奇数的因子,并要认识如何分解的。若A要通过公共信道向B送去信息M,由于公共信道缺乏足够的安全保护,信息容易被第三者获取,甚至被篡改,为此在M进入公共信道之前,先对它进行加密变换成密文C,A将密文C送给B,B收到后对C作解密变换,恢复M,故一个有几个用户的信道网络,两两间的秘密信道共需img1 n(n-1)个密钥。当n= 1 000时,则img2n(n-1)= 499 500,即约有50万个密钥,而密钥的安全性依赖于将一个大整数分解为奇数积。

由上可见,信息技术几乎就是数学技术。

(3)数字化技术

正在发生一切“出乎意料”的“革命”就是“数字革命”。所谓“数字革命”是指从模拟向数字化转化。数字化就是用0和1来表示所有的信息,每秒数百、数千、数万、数亿比特的存取和传输技术才有可能实用化。电报是4位数编码传送的信息。微电子技术是数字革命的关键。其难题是1秒内要控制亿、百亿次的开关。这是半导体技术。现在更理想的是光半导体,超导开关技术。信息传输都与频率直接联系。电话是频率4千赫以下。300、3 000到20兆赫以下的长波、中波、短波广播可传输声、像、色的电视,约有50个频道。光波可到1 014~1 015赫,每秒振荡亿次。由于散射并不实用,而激光是能量集中、颜色单一、方向性强的光,因而很适合传输大容量的信息。这种光必须在透明体极高的光导纤维中传播。3千克光纤相当于1吨重的铜线的功能,但生产耗能只有铜的5%。

数字技术包括微电子、计算机及软件技术、通信技术和自动控制技术,这是一个信息技术群。1993年东芝生产的第三代16兆位芯片,存取速度已达每秒500亿次。

数字技术是带动21世纪经济增长的火车头。未来将把电话、计算机、电视结合在一起。克林顿曾发表《技术:经济增长的发动机的竞选声明》,未来将以数字方式把世界所有的书、报、电影、电视等存储在多媒体数据库里。33卷的《大不列颠百科全书》只需4.7秒即可全部传输到任何一个地方。装有2.5亿只晶体管的芯片将把一台超级计算机压缩到一张信用卡大小的装置里。光纤的传输速度将以每万亿比特计算,一根光纤在几分之一秒之内就能传输一部电影,而单位成本却急剧下降,这就将把廉价的数字技术送到地球上的每个角落,地球就像现在的一个村庄。与此同时,数字技术的发展,还会带来很大的不确定性。未来的10年内,技术上的世界领先地位是可以竞争的,竞争中谁能折桂,确难预料。

目前人们所获得的信息处理能力越来越多。据国际数字公司称,全世界的买主前几年每年抢购约5 000万台PC机,它们将落到未感受到计算机效率的学校、医院和政府机关里。正如贝尔实验室主任所说,下一阶段的信息革命将不仅改变工业而且改变社会本身。数以千万计的个人手中有PC机,世界经济就会发生深刻变化。零售商将利用网络同全球的客户接触,发货人将使用立足于卫星全球的定位系统,以厘米级的精确度跟踪收集装箱船、小到包裹的一切东西,某些大医疗中心的专家可使用高速电视会诊线路去诊断和治疗遥远地区的病人;在文化教育方面,以巨资兴建数字图书馆,它将向全国学生提供利用图书馆藏资料的无限可能性;在出版和娱乐方面,人们将直接从“比特流”(即在电脑空间中不断地流动中显示数字电视图像、音响资料和数据)中提取新闻、电影、电视或文献。

建造一个数字世界的内部结构——硬件、软件、光纤和微处理器等——将会导致计算机产业和信息产业的重组。

由于数学是数字技术发展的基础,中国、印度等有长期良好数学教育传统的国家,基础良好,正在挑战数字技术,争做数字技术的强国。韩国已经打破了日本在存储芯片和消费电子产品方面的垄断。三星集团在1984年世界存储芯片行业中排名还只占第9位,到1993年急升到第一位。我国台湾省已占全球PC机装备业的大部分,不仅制造计算机外壳、键盘,而且2/3的母板(含微处理器和其他芯片)也由其制造。

数字技术已把强大的科研工具送到科学家的桌子上。超级计算机和高级软件降低了对昂贵实验设备的需求。更优良的仪器、更逼真的模拟和更快的科学杂志检索方法已使科学家们能在实验室里做出5倍于15年前所做的事。这是发展中国家也可以做到的。

当今,在世界范围内,通信系统正走向数字化,并在数字化技术的基础上,向智能化、个人化方向发展。

随着人们对数字、文本、图形、图像等通信业务要求增长,多媒体通信将是新的通信要求,而数字化技术是实现多媒体通信的基础。综合业务数字通信网(ISDN)就是典型的多媒体通信系统。它可以在一条线路上同时快捷、方便地传递电话、数据、传真、图像等多种信息,美国苹果公司推入市场的名为“牛顿”的个人数字助手(PDA)系列产品可称得上是高技术的数字化多媒体个人通信设备。还有《个人电子通信簿》,体积小、功能强。这个装置有计算机技术、通信技术和常用电器,可打电话、发传真、接收电子邮件,还可以处理信息,并将其分类、加工和编辑。香港地区电话网络已全部数字化,现在每接通1次电话比数字化以前快12秒,全港每日节省的接通电话的时间高达2.5万小时。许多国家和地区正在开发数字化的可视电话。

过去我们搞电化教育,而现在我们要搞的是“数字化教育”(Digital Education),简称DE,数字化教育的主要形式是:数字化教室、阅览室等,其具体含义是超文本服务器网络计算机(NC)+浏览器,用公式表示如下。

数字化教室=Web服务器+ NC+浏览器

每一所学校,可以采用Web站下载技术,有计划地从国际互联网的Web站点自动地获取随时更新的相关信息,不断充实本校的数字化教育中心。教室里的PC机直接与全球联系,使PC机不仅是辅助教育的工具,而且成为教育的一个主体部分,使PC机的显示屏和黑板一样重要。互联网将是常规课堂的一种延伸,除教师教学之外,让学生直接与世界沟通,开阔自己的眼界,迎接迅速变化的信息时代。在今后,采用NC建立一个连接着世界的先进的数字化教室,费用并不高。采用离线(off-line)方式,运行Web服务器,形成一个交互式的数字化教育环境(教室、阅览室)是完全有可能的。这样,有利于对学生的素质教育,培养21世纪的人才。我们要搞的是连接世界的网络化的数字化教室,而不仅仅是电脑教师。

21世纪伊始,人类向数字技术发起了新的挑战。无论是电视会议系统,还是电子商务,贯穿于信息高速公路的各种数字技术已实实在在地改变着我们的生活,改变着这个社会的工业和经济运作模式。

(4)CT技术

20世纪70年代,由于使用了巧妙的计算,出现了一种神奇的医疗仪器——X射线计算机分析摄影仪(简称CT)。在不损害病人身体的前提下,医生可观察到人体内不同部位的断层图像或三维图像,从而可对疾病作出迅速的准确的诊断。美籍南非人科马克(A.M.Cormack,1924年生)由于巧算为发明CT奠定了理论基础,与CT发明者豪斯菲尔德(G.N.Hounsfield,1919年生,英国人)一起分享了1979年的诺贝尔医学与生理学奖。科马克发表了论文《函数的线积分表示与一些放射学应用》(Ⅰ)、(Ⅱ),《143-mev极化质子的小角度散射》,《以中子为目标的交叉断层的测量》。根据他自己的理论,科马克绘出了图像重构所必需的公式,即解决了发明CT的理论问题,为发明CT技术奠定了基础。所谓图像重构过程,就是利用计算机将样品各个不同角度的X射线投影组合起来,形成扫描样品的物像。人们知道,1895年伦琴(W.C.ROentgen,1845—1923,德国人)由于发现了X射线而获1901年首届诺贝尔物理学奖。X射线在被发现后的一个多世纪中,在医学、工程技术、晶体化学等方面得到相当广泛的应用。

CT是英国EM I公司的豪斯菲尔德于1972年发明的,目前广泛使用的CT属于第三代。它采用扇形扫描方式,扫描1周仅需5~10秒。在扫描过程中,X光源和检测器同时转动。由于不同物质对X射线的阻力不同,从而有不同的衰减系数。人体各部分的衰减系数自然也不相同,于是可得到衰减系数在人体各部分的分布。问题在于,只能得到测量的X射线穿过人体的直接的减系数的平均值(积分值),通过平均值获得实际分布,这就是技术突破的关键。科马克通过在测量中运用极坐标把问题转化为数学问题。

穿透人体的X射线束的初始强度I0与穿透后的强度I之比的自然对数和X射线的衰减系数(X,Y)的体积分值成正比关系

img3

不同方向的投影值P(X,0)可测量得到。由P(X,0)求N(X,Y),数学为其提供了诸如二维傅里叶变换法、一维滤波反射影法等近10种方法。其基本数学工具是傅里叶变换。如有计算公式

img4

公式的含义为:先将投影值变换到频域,求得F1(投影值),再变换为二维直角坐标,最后得到傅里叶逆变换反演到真实空间,从而得到重构图像。

又如有计算公式

真值=反投影(投影值* K)

式中,*代表卷积,公式中是利用投影值和滤波函数K作卷积运算,相当于在空间域进行滤波,去掉噪声。这种方法重构图像质量好、计算量少、计算格式简单、硬件容易实现,可快速高效得到CT图像。

CT机装置由主计算机、高频高压发生器、X光球管、数据采集系统、扫描控制部件、阵列计算机、诊断台、多幅照相机和CT软件共九大部件组成。

数学技术主要在CT软件中发挥了关键作用。CT机的机械扫描措施系统首先进行扫描,将X射线穿透人体原检测器得到的采样值——投影值,进行道通正确性、偏差值和射束硬化等校正及处理,并通过阵列计算机完成卷积和反投影运算。然后再进行显示、准备等后处理。最后完成图像存贮、显示和照相输出等工作。

CT研制成功关键是利用积分变换,这是CT理论的核心。当然用到的数学理论还有级数、数论、群论、概率、统计等。因此,CT这项高技术成果本质上是数学技术。诺贝尔评奖委员会将其资金的一半给了不懂医学的数学家科马克也就毫不奇怪了。

(5)预测技术

对事物的发展方向、进程和可能导致的结果进行推断或测算的技术,称为预测技术。该技术是在调查研究事物历史和现状的基础上,通过各种主观和客观的途径及其相应的方法,预测事物的未来,为最优决策提供科学的根据。预测技术是20世纪中期发展起来的以数学为基础的一种技术。

二次世界大战后,科学技术迅速发展,高技术产业不断涌现,国与国、地区与地区的竞争愈来愈激烈,人口增长、能源危机、环境污染、生态平衡破坏、局部战争不断等问题的出现,推动了人们对未来的发展进行预测,以避免一些灾害问题的发生或对某项科学技术的走向、或对经济态势进行预测,以便尽早作出科学决策。

社会是个复杂多变、互相关联的系统。没有什么系统是孤立的。任何一个规模或计划都要以一定预测为基础。一个国家的长期国民经济发展规划或年度的发展计划,均应建立在科学预测的基础上。科学预测业已成为国家或地区或集团公司等制定发展战略的重要依据。科学预测具有明显的政治效果、社会效果、经济效果。

美国曾作过估算,通过预测技术对某高技术产业进行预测可获取的利润及实际所得相当于投资预测费用的50倍。

预测的结果的可靠与否,在很大程度上取决于方法的选择。不同的预测方法,结果不尽相同,但若真正的科学预测,一般说来,结果的可信度是相当高的。例如,笔者作过奥运会成绩的预测,精度达97%以上。

一般说来,预测方法选择越精当、考虑的因素越广泛深入,预测的结果就越精确。

科学预测分为短期(1年内)、中期(5年内)、长期(5年以上)预测。短期和中期预测最重要,这样有利于制定年度计划和5年计划。一般说来,科学预测是时间的迭代函数。例如,要对一个系统发展进行预测,今天的输出是明天的输入,若今天要预测明天的结果,精度可以相当高。“凡事预则立,不预则废”。我们为了事业发展,推广普及预测技术是非常必要的。

预测的对象可以是一种科学技术、一种产品、一项工程、一种需求、一个社会经济系统或者一项发展战略,或是国际发展趋势,这些常涉及社会、政治、经济、科学、技术、管理等各个领域。预测对象按照是否受到控制的影响可划分为两大类:第一类不受主动环节(人或智能物)强烈控制的系统,称为自然预测系统,如天气预报、地震预报等;第二类是受到预测一方或非预测一方主动环节强烈控制的系统,称为受控预测系统。以人口的预测为例,在政府对人口没有强大控制作用的国家中是属于自然预测系统;而在政府对人口具有强大控制能力的国家中,就属于受控预测系统。再如,自由竞争的市场可被看做是受多种扰动的自然预测系统,而受到垄断的市场则属于受控预测系统。

预测一般分为主观预测和客观预测。主观预测主要依靠人的经验、预感、直觉等来进行预测。主观预测虽然带有较多的主观成分,但同时也有相当多的客观成分。在原始资料严重不足的条件下,应用主观预测常常难以避免而常能成功。特尔斐(Delphi)法是二次大战后发展起来的一种主观预测法。这是由美国兰德公司20世纪50年代的一项研究计划而来的。当时兰德公司受美国空军委托实施一项预测,称为“特斐尔计划”,其过程是,“利用一系列简明扼要的征询表和对征得意见的有控制的反馈,从而取得一组专家的最可靠的统一意见”。用此法进行预测,投入小,而可靠性较高。客观预测包括经验、模拟、模型和数学推理等。在采用特尔斐法、主观概率估计等科学手段之后,经验法的主观成分可以大为减少,客观成分可以大为增加。模拟实验是在真实系统中进行局部试点和抽样调查,而后放大样本,对母体作出判断预测。如,对某项新产品要预测未来社会市场的需求,可通过展销实况来进行预测。模型主要是指数学模型。在自然界与社会中,常常存在着互相制约、互相依存的变量,如粮食产量与化肥用量、生铁产量与钢产量、气温与温度等,它们的关系可用数据公式表示出来。回归分析是一种定量的预测技术。根据实际的统计观测数据,通过数学计算,确定变量和变量之间互相依存的数量关系,建立合理的数学模型,推算变量的未来值。20世纪90年代以来,由于电子计算机的广泛应用,以数学软件为主要技术的预测技术得到了迅速的发展。

预测一般有如下一些步骤:一是明确预测任务或目标;二是确定预测的时间界限;三是掌握事物发展规律和有关的数据、资料等信息,分析历史上发生的偶然事件,预估未来偶然事件发生的可能性;四是精选预测方法;五是建立相应的预测模型;六是对模型进行分析或模拟;七是对模型外部因素进行分析;八是进行预测;九是对预测结果进行评估,如可用已发生的结果进行检验;十是可能用多种方法进行评价,加以比较。

以公交车月均客运总量作为我们预测的对象,它要受到工业布局、人口密度、住宅区分布、职工出行特征等影响。研究表明,一个大城市可变因素达万余个,甚至到20多万个。据此,可采用数字时间序列分析法来进行预测。这当然是一个典型的数学技术。它的基本依据是:“一种事物过去随时间而变化的样式,即为该事物今后随时间而变化的样式。”

我们首先进行时间序列平稳性检验。经检验,预测对象形成的时间序列是平稳的。这正是可用数字时间序列分析的模式进行预测的依据。

我们要分析两种时间序列:一是年日均客运总量;二是年月票发售总量。把它们的曲线画在同一坐标系内,可以发现它们几乎是按比例在变化。可以假设它们之间存在线性关系。可以用线性回归模型并用最小的乘法求得系数,再检验其相关性。最后根据该数学模型进行预测。

时间序列分析是典型的趋势外推技术。如果预测的对象的过去发展趋势将会延续到预测的未来,又掌握了足够的信息,则可指望用此法预测得到较精确的结果。它的缺点是无法预测可发生的偶然事件。

预测技术在本质上是数学技术。当然,不同的预测技术中数学技术的含量不尽相同。

(6)通信技术

通信技术的起源可追溯到1736年苏格兰的电信号装置。1753年又有一位苏格兰人提出了一种由每一字母所配备的24根金属线来吸动“木髓球”的电报机。后来有人建议使用两根金属线和彼此商定的组合字符传递信息。1809年有人做成了电报试验,是最早使电报得以实现的试验之一。不久,又有人研制以电磁效应为基础的电报机。1833年有一位发明家创造了一种电报机,其信号是通过5~6个磁针的偏转按照统一的电码发送的。不断有人发明各式各样的电报机。真正有价值的电报机还是莫尔斯(S.F.B.More,1791—1872,美国人)于1837年发明的电报机。19世纪后末叶主要致力于改进传输线路的充分利用和快速传输两大问题。直至1915—1920年间按印字电报终于问世。1932年研制成功自动电传打字电报系统。

真正有实用价值的电话机是1826年贝尔(A.G.Bell,1847—1922,苏格兰人)发明的。自动电话通信应归功于一位美国人于1889年发明的拨号盘电话机。

通信设备真正改善还是发明二极管、三极管以后的事。另一方面,1936年图林用布尔代数的逻辑概念提出数学存贮概念。1938年申农又将布尔代数与继电器结合起来。这些为现代通信技术的发展奠定了理论基础。接着有人提出模拟继电器计算并进行研制,还有人发明了真空管电子计算机。诺依曼提出的数据存贮和编码理论对推动通信技术起着十分关键的作用。1948年申农的《通信的数学理论》,就是从根本上证明了通信技术本质上是数学技术。1962年美国发射第一颗通信卫星,开创了空间通信的时代。1968年,美国贝尔实验室建立集成光学,研制成集成光路及其各种元、器件,为取代集成电路创造了条件。1991年贝尔实验室发明光孤子传输信息。1998年,该实验室宣布每根光纤每秒可传输400千兆位的信息,比过去提高了5倍,即每束8根光纤传输了每秒3.2万亿位的信息量。

这里要特别提光孤子问题。这得从一个伟大的发现说起。孤立波的发现者罗素(J.S.Russell,1808—1882,英国人)1834年8月在爱丁堡川格拉斯哥的运河上进行勘探。10年后罗素描述说,“我观察过一次船的运动,这条船被两匹马拉着,沿着狭窄的河道迅速地前进,被船体带动的水量不算太多。突然,船停止了前进,船头周围聚集了急剧运动状态的水流,它们形成了一个巨大的圆而光滑的水峰,又突然离开船头,以极大的速度向前移动。这水峰约有30英尺长,1~1.5英尺高,在行进中,一直保持着这起初的形状,速度也不减慢。”这是罗素的伟大发现。后来他以毕生的精力进行探索,曾在一条6英尺的小河道中人工再现了一个小孤立波,并导出一个经验公式。直到1895年,有两位数学家在研究单方向运动的浅水波时导出了被称为kdv的方程,这是一个非线性偏微分方程,有一个特解犹如一个向右运动的脉冲,正好对应了当年罗素发现的孤立波。此后并没有太多进展。直到1965年,美国两位学者公布了对kdv方程的电子计算机作近似解的结果,发现了两个孤立波碰撞后居然保持各自的波形和速度不变而继续前进。孤立波有犹一粒子的特性,并命名为孤粒子。它是一种特殊的孤立波,是一种具有某个“安全系数”的孤立波,在相互作用后只有微弱的变化。接着孤粒子的报道接二连三,小至基本粒子,大至木星上的红斑,从生物学中神经细胞轴突上传导的冲动,到磁晶体中的布洛赫壁运动,都存在孤粒子。

贝尔实验室对孤粒子特别关注。这里的科学家强调孤粒子在超导研究中的应用,他们发现超导电子对波函数的位相差正好满足另一个典型的孤粒子方程。他们还发现在超导传输中,孤粒子解存在。他们又发现一种称为约琴夫逊(B.D.Josephson,1940年生,英国人)结的开头速度可达每秒(50~100)×1012次,而热损耗仅为普通晶体的千分之一。更引人关注的是,该室将孤粒子运用于通信传输,在光学纤维中运用孤粒子能使传递量从每秒1亿个信息单位提高到每秒1万亿个信息单位。

另外,申农还把统计和概率的技术运用到通信技术中,并以概率论为基础重新定义了信息和信息量,从而使通信技术建立在更加数学化的基础上。

通信技术发展史告诉我们,如果从1736年算起,直到20世纪80年代初,大约有250年,但突破性进展应是从1948年申农的《通信的数理论》算起,特别是将孤粒子应用于光纤通信后,才有了今天的辉煌进展。从这个角度可以再一次说明,高技术本质上是数学技术。

(7)数据库技术

该技术的发展与计算机硬件、软件的发展紧密相关,大致经历了三个阶段。

工管理阶段。20世纪50年代中期之前,计算机主要用于计算,它需要的数据不多,外存储器也不大,只用简单的监控程序来控制程序的运行。由于数据不长期保存在计算机中,程序中用到的数据由程序员在应用程序中自行管理。程序员除了编制程序外,还要考虑数据的逻辑定义和物理组织,以及数据在计算机中的物理存储方式,程序和数据混为一体。在需要引用数据时,直接按照地址存取。

文件系统管理阶段。在20世纪50年代后期到60年代中期,计算机外存中增加了磁盘、磁鼓以后,软件方面增加了操作系统,其中的文件系统是专门管理数据库的软件。文件中的数据以“记录”的形式存放,记录由某些相关的数据项所组成。每个用户可以建立、修改和使用一个或多个文件。数据被组织成文件以后就可以脱离处理它的程序面积而存在。用户在程序设计中只需考虑数据的逻辑结构和物理特性,按规定的方式建立文件,按规定的方式使用文件,而不需考虑数据在物理存储介质上的位置。

数据库管理阶段。20世纪60年代以后,随着数据量急剧上升,为克服文件系统的缺陷而产生了数据库技术。数据库系统使数据在统一的控制下为尽可能多的应用程序服务,即实现数据的共享。同时使应用程序与数据尽可能地相互独立。在数据库技术中,还提供了对数据的安全性、完整性、保密性进行统一控制的数据库管理系统(简称DBMS)。数据库系统要求硬件有足够大的内存存放操作系统、DBMS、应用程序等;还需要足够大的外存存放大量的数据信息;要求软件有支持DBMS的操作系统和DBMS本身。

DBMS对数据进行管理,是构成整个数据库系统运行的核心,它起着用户的应用与整个数据库的接口作用,它接受、分析并解释用户提出的命令请求,然后转到相应的处理程序中去操作(检索、存储、更新)数据库中的数据。

数据库描述和模型。在数据处理中,首先要将现实世界转换成信息世界,再转换成机器世界。客观事物在信息世界中称为实体。一个学生、一本书都是实体。实体的集合称为实体集。反映实体之间的联系称为实体模型。实体具有属性,如一个人的身份证号码。这类的属性又称为属性的值。唯一标识实体集中属性的,称为关键字,如一个人的身份证号码。实体模型是一种静态模型。

信息世界的信息在计算机中是以数据形式存储的。一个实体的数据称为一个记录。标记实体属性的符号称为数据项。同类记录的集合是一个文件,它描述一个实体集。能唯一标识记录的一个或多个数据项的值称为文件的关键字。把组织文件的关键字称为主关键字,把不能唯一标识记录的数据项称为辅关键字。

数据项、记录、文件都是数据的重要单位,合称逻辑数据。当把它们存储在计算机的存储介质上时就称为物理数据。

数据模型是对数据库系统的一个抽象模拟,表明数据库系统中的信息如何表示和如何操作。一个数据模型由三部分组成:对象类型集合,操作集合和完整性规则集合。其中对象类型是数据模型最基本的部分,它将确定逻辑结构,即信息如何组织,这是我们讨论的重点。操作提供对数据库操纵的手段(包括检索、修改、定义可存取的数据集,定义存取权限等)。完整性规则是对数据的存效状态的约束。

数据库系统可划分为三类:层次模型、网络模型和关系模型。

层次模型用树形结构表示0实体及其之间联系的模型。它是由若干个基本层次联系组成的一棵树,树的每个结点代表一个记录类型。该模型的实际存储数据由链按指针来体现联系。层次模型有两点限制:一是有且仅有一个结点无交结点,此结点即为树的根;二是其他结点有且仅有一个交结点。

网状模型是用网状结构表示实体及其之间联系的模型。网中的每一个结点代表一个记录类型,联系用链接指针来实现。

网关模型和层次模型在本质上是一样的。从逻辑上看,它们都是基本层次联系的集合,用结点表示实体,用有向边表示实体间的联系。

面对对象的数据库是面向对象的概念与数据库技术相结合的产物。面向对象模型中最基本的概念是对象和类。对象是现实世界中实体的模型化。每个对象有一个唯一的标识符,并把一个状态和一个行为封装在一起。类由两部分组成,其一是对象类型;其二是对这个对象类型进行操作的方法。所有的类和子类组成一个树状的类层次。

关系模型标志着数据库技术走向成熟。它用二维表的形式来表示实体和实体间联系的数据模型。从用户观点来看,关系的逻辑结构是一个二维表,在磁盘上以文件形式存储。关系模型的最大优点就是简单,一个关系就是一个数据库表格,它是由行和列组成,这样就简化了数据的设计。

数据库系统一般分为三级:面向用户的或应用程序员的外级;面向建立和维护数据库人员的概念级;面向具体实现在计算机中存储的人员的内级。各级有各自的描述语言和内容,数据在各级之间进行转换或映射。描述信息和数据的格式及方法称为模式。在外级的称为外模式,在概念级的称为概念模式,在内级的称为内模式。

建立数据库系统的基本要求是能保证数据库的独立性、冗余数据少、系统的用户接口简单、能够确保系统运行可靠、有重新组织数据的能力。具有可修改性和可扩充性,能够充分描述数据间的内在联系。

数据库技术研究的几个主要方向是:实现数据库的标准化,研究现有的主要数据模型之间转换或者对现有的数据库进行简化和统一;研制数据库计算机,以提高数据库系统执行的文件;改善数据库设计方法,制定完善的工程规范,逐步提高数据库设计的自动化程度;建立分布式的数据库系统,这是计算机网络技术与数据库技术相结合的产物;创建智能数据库。

数据库技术中还有一个重要的问题是数据加密的问题。将数据编成密码技术,是计算机通信或数据存储中对数据采取的一项安全措施。在数据存储或传输前加工成密码数据或密码文件称为加密。在使用这些数据和文件之前再将其还原成原来的样子,称为解密。加密有三个目的:保证通信安全,使传输中的数据只有指定的接收者才能了解其真意;接收者可以验证数据的真实性,防止有人伪造密码数据;电子签名,发送者用加密的方法建立一个签名,别人可以鉴定该签名的真实性,这在电子资金汇总系统中有重要的用途。

为了节省信息的存储空间和提高信息的传输效率,对信息编码长度进行压缩的技术称为数据压缩。这样做可以节省很大的费用。

数据库管理系统是指用以描述、管理和维护数据库的程序系统,是数据库系统的核心组成部分。它建立在操作系统的基础上,对数据库进行统一的管理和控制。它主要有四个功能,第一,描述数据库:描述数据库数据的逻辑结构、存储结构、语义信息和保密要求等;第二,管理数据库:控制整个数据库系统的运行,控制用户的并发性访问,检验数据的安全、保密与完整性,执行数据检索、插入、删除、修改等操作;第三,维护数据库:控制数据库初始数据的装入,记录工作日志,监视数据库性能,修改更新数据库,重新组织数据库,恢复出现故障的数据库;第四,数据通信:组织数据的传输。

数据库管理系统通常有三部分:数据描述语言及其翻译程序;数据操作语言及其处理程序;数据库管理例行程序。

(8)决策技术

为最优地达到目标,对若干个准备行动的方案进行的选择称为决策,含决策工作和决策行动。抉择工作是指从认定目标到拟订方案的整个过程,一般是决策者委托咨询专家委员会来进行。决策行动是决策者对专家们提出的预选方案进行选择。决策是领导者的基本职能。科学地进行决策是保证社会、政治、经济、文化、科技、教育、卫生、金融等顺利发展的重要条件,有的影响国家安全,有的影响国家稳定,有的影响人民的生命财产安全,总之影响巨大。决策一般有经验决策和科学决策。还可分为战略性决策和战术性决策。按目标分为最优决策和满意决策。按决策的条件和后果分为确定型决策和不确定型决策。不确定型决策又可分为马尔柯夫决策、模糊决策、风险决策和竞争决策。

科学决策一般要经过如下三个方面:一是实行科学的决策程序;二是采用科学的决策技术;三是用科学的思维方法作决策。

科学决策程序有8个阶段:发现问题;确定目标;价值标准;拟订方案;分析评估;方案选优;试验验证;普遍实施。决策者对发现问题、确定目标、价值标准、方案选优必须亲自作出决定,而其余任务可以交给咨询专家去完成。

科学决策常采用定量分析与定性分析相结合的方法。一般有调查研究、咨询技术、预测技术、环境分析、系统分析、决策分析、可行性分析、可靠性分析、灵敏度分析、风险分析、心理分析、效用理论等。

如果是不确定性的决策,则决策分析是十分必要的。一般应有四个步骤:形成决策问题,包括提出方案和确定目标及其效果量度;用概率技术来定量地描述每个方案所产生的各种结局的可能性,即用概率来描述;决策者对各种结局的价值定量化,一般用效用来表示,效用可用效用值来定量,有了效用就能给出偏好;综合分析和评价各方面的信息,以最后决定方案的取舍。

决策技术本质上是数学技术。

如果是确定性的情况,每个方案只有一个结局,此时可用数学的穷举法,通过对每个方案的结局进行比较(只有有限个),然后用优选法选出最优方案。

如果是不确定性情况,即随机性或风险性情况,则每个方案都有几种结局的可能,即以一定的概率发生。此时,可用随机性决策,即决策树的技术。若不确定性连发生概率也不知道,这时可用不确定型决策技术。由于决策总是在事件发生之前作出,而事件是否发生又不确定,因此可对事件发生的概率作先验估计,这称为见叶斯决策方法。

如果一个方案可用时引出多个结局,这时可用多目标决策方法。例如可用多目标规划技术。一个多目标规划问题通常存在许多个有效解。在自然序意义下,因各有效解之间相互不能进行比较,因而要在它们之中加以选择,就需要引入一个偏爱序。这相当于要从抉择者那里得到另外的信息。如何选取这种另外的信息以提炼成一个偏爱模式,并且在某种偏爱关系的基础上建立起有关的数学理论,这就是多目标规划要研究的重要内容。把多目标规划问题归为单目标的规划问题进行求解,即所谓标量化的方法是基本算法之一。具体有线性加权和法、理想点法、分层求解法等。

如果是多人决策情况,则在同一个方案内有多个决策者,他们的利益各不相同,对方案的结局评价也各不相同,这时可采用对策论、冲突分析、群决策等方法。如果对结局评价有模糊性可采用模糊决策方法和决策分析阶段序贯进行时所采用的序贯决策方法等。

决策技术的理论基础是决策论。它是关于不确定性决策问题的合理性的分析过程及有关概念的理论。决策论的理论基础是假设决策中有吸引力的备选方案依赖于两种因素:对决策者选定的某个决策方案所引起的数种可能后果的似然性(指相似的程度)的判断;决策者对各种可能后果中每一后果的倾向性。但是,这些因素在同一个决策问题中往往是联系在一起的,因此在决策分析中必须把它们分开。为进行决策分析,常利用主观概率和效用理论分别对后果的似然性进行判断以及对后果的倾向性加以量化,然后再利用数学技术。

效用理论是决策论的理论基础。事物不确定性可看作是许多简单随机事件的集合。每一个简单随机事件是由两个互作事件a1和a2组成的。事件a1发生的概率为P,事件a2发生的概率为1-P,则随机事件记为L(a1,P-a2)。在简单随机事件的集合内引进“优先”或“偏好”的概念。在此随机事件集合的基础上建立合理化体系。即假设在随机事件集合中存在下列条件:相对偏好顺序;偏好关系具有可传递性;简单随机事件间的可比性;偏好可以量化;不确定性判断可比量化;等价随机事件可互相替代。

在以上条件下,可用一个数值来描述简单随机事件的期望效益,称为效用。由简单随机事件的效用可确定一般不确定事件的效用。在对事件不确定性判断进行量化时,需要利用各种知识,如统计知识等。

决策树是一项具体的数学技术,也是常用的决策技术。

为了利用电子计算机帮助决策者利用数据或模型来解决非结构化或未结构化决策问题,建立交互式信息处理系统(DSS)是必要的。它通过人机对话等方式为决策者提供一个良好的决策环境。帮助分析问题、建立模型、模拟决策过程和效果,使决策者充分利用信息资源和分析工具,从而提高决策水平和决策质量。

(9)航天技术

航天技术的发展引起了人类社会的变革。它影响到通信、气象、导航、冶金、材料、加工、医学、能源、军事、地质、矿产、农业、文化、科学探测、天文学等领域,是人类社会前进的强大推动力。

利用火箭进行太空飞行的设想和理论是俄国航天先驱齐奥尔科夫斯基(K.D.Tsiolkovsky,1857—1935)首先明确阐明的。1897年他推导了著名的火箭运动微分方程式。他还导出了火箭要克服地球引力要具备的最小速度即第一宇宙速度为每秒8千米。1911年,他详细地描述了一艘载人宇宙飞船从发射到进入轨道的全过程。

法国的埃斯诺·贝尔特科(R.E.Peltaire,1881—1957)、美国的戈达德(R.H.Goddard,1882—1945)、德国的奥伯特(H.Oberth,1894—1989)等也作出重要的贡献。如埃斯诺·贝尔特科基于动量守恒和能量守恒定律导出了火箭在真空中运动的方程式,求出火箭的逃逸速度为每秒11.28千米。又如戈达德在液体火箭研制和试验上取得了极大的成就。

1957年10月4日,苏联第一颗人造地球卫星发射成功,这是人类进入航天时代的标志。航天技术的发展,使人类突破了大气层的屏障,摆脱了地球引力的束缚,使人类的活动范围从陆地、海洋及天空扩展到广阔无垠的天空。苏联之后,美国、法国等相继也发射人造卫星,接着日本、中国、英国等国也在努力跟上。1970年9月24日,中国长征一号运载火箭首次发射成功,将第一颗人造卫星送入轨道,标志我国亦跨入了航天时代。

航天技术是一门综合性极强的高技术,涉及众学科,但是不管涉及什么学科技术,本质上都是数学技术。

火箭发动机是航天运载火箭以及航天器的唯一动力装置。依据的原理是牛顿第三定律。液体火箭发动机一般由推力室、推进剂供应系统和发动机控制系统组成。火箭发动机的控制系统包括工作的程序控制、工作参数控制、推力矢量控制,这是控制技术。运载火箭的主要技术指标包括运载能力、入轨精度、对各种不同重量和尺寸的载荷的适应能力和可靠性,这些同样离不开数学技术。

控制系统是运载火箭和航天器的重要组成部分。运载火箭的控制系统基本功能要求在发射和飞行过程中,通过控制使其按预定的轨道飞行,将有效载荷精确送入轨道。控制系统还须对火箭进行姿态控制,以保证在各种干扰条件下稳定飞行(即姿控),控制各分系统工作状态变化和信息传递,在发射前对运载火箭进行检测测试,并实施发射控制(即发控)。控制系统的箭上部分通常称飞行控制系统,地面部分通常称测试发控系统。

运载火箭的控制系统按功能分由制导系统、姿态控制系统、电源配电系统和测试发控系统组成。制导系统控制运载火箭的质心运动,使其按预定的飞行弹道飞行,保证卫星或飞船准确入轨。姿态控制系统控制运载火箭绕质心的运动和运动姿态。制导系统是运载火箭控制系统的核心。

航天器控制包括轨道控制、姿态控制、温度控制、数据控制、设备管理、任务控制等。轨道控制实际上是控制航天器的运行轨道,使其进入并保持在预定的轨道高度上。姿态控制是使航天器按预定的姿态运行,如保持通信卫星的天线始终精确对准地球、保持资源卫星探测器对地球特定区域定向、保持天文卫星的望远镜精确对准被观测天体等。

航天器轨道运行时,为了完成它们承担的各种任务,必须具有并保持一定的状态,保持精度根据不同航天器有不同的要求。对地观测卫星的照相机或其他遥感设备必须精确对准地面。通信卫星的天线必须精确对准地球表面特定地区。天文卫星的望远镜或射电天线必须精确对准所要观测的天体或天区。航天器的太阳电池翼必须对准太阳,以获得最大的太阳光照。要完成航天器既定任务,姿态控制与保持是十分关键的要求。

航天技术还包括材料技术、电子电器技术等。

航天器的应用十分广泛。

通信卫星使通信发生重大变化,尤其是移动通信正在全世界普及。美国的导航星全球定位系统虽出于军事目的,但也成功地用于全球个人移动通信中。美国摩托罗拉公司拟在6个轨道平面660千米高的轨道上布置66颗小型通信卫星,实现全球移动通信。

气象卫星上装有各种气象遥感器,能够接收测量地球及其大气层的可见光、红外线和微波辐射,并将它们转换成电信号传递到地面。地面台站将卫星送来的电信号复原,绘制成各种云层、地表和深面图层,再经进一步的处理和计算,即可得出各种气象资料。气象卫星所能观测的地域广阔、观测的时间长、观测数据汇集迅速,因而可以提高气象预报的质量。

地球资源卫星的应用范围广泛。在农业方面能够估计作物产量、估计土壤含水量、早期预报病虫害、报告森林火灾、野生动物调查、渔汛探测等。在环境监测方面能够调查内陆水资源、监视海岸侵蚀、进行地震和火山探测、地理学绘图和地质学研究、大气流以及海洋污染调查、臭氧层监视等。在矿物调查方面,能够通过岩石的光谱特征和地形的类型来识别矿物种类和贮量,对地区能源进行查明和估计贮量、勘察海洋石油资源等。

总之,航天技术的任何一项技术本质上都是数学技术,尤其控制技术就是数学技术。

(10)航空技术

威尔伯·莱特(W.Wright,1867—1912)和奥维尔·莱特(O.W right,1871—1948)兄弟研制成功载人动力飞机,真正成为航空先驱者。1903年12月17日,他们设计的第一架飞机——“飞行者1号”由奥维尔驾驶成功地升空飞行,虽只飞行12秒钟,飞行36.6米,但为人类征服天空揭开了新的一页。他们虽是美国人,但美国新闻界反应冷淡。1908年8月8日,威尔伯驾驶新飞机在法国芒斯的赛马场进行了首次飞行表演,一下子使法国震惊了,激发了欧洲人对航空的热爱,唤起许多人投身航空事业。飞机的价值首先在战争中显示出来,并推动了飞机制造业的发展。至1918年,全世界有2 000个专业飞机制造公司和80个发动机制造公司,5年间生产发动机235 000台,飞机183 877架。20世纪30年代,由于扩军备战,航空技术有了长足发展。航空技术亦是一门综合性很强的高技术。20世纪前20年,升力与阻力特性越来越清楚,用数学方法描述飞行稳定性取得初步的成功,空气动力学研究的成果也应用于飞机设计。自此之后,数学家、物理学家和飞机设计师建立了合作关系。20世纪20年代以后,飞机的设计、稳定性改进、强度计算都有了明确的科学准则。30年代战斗机飞行速度已达每小时200千米。在二次世界大战中,飞行速度提高,除颤振外,又出现了飞机抖振、飞行噪声、操作失稳、操纵反逆、失速等问题。到20世纪60年代,由于空气动力学的新突破,为非定常空气动力学研究提供了新方法,由于风洞技术高度发展,计算空气动力学的兴起,飞机的许多问题都得到初步解决。随着主动控制技术的发展和应用,改善了飞行器的特性。主动控制技术是利用控制系统提高飞机性能的一项数学技术,是20世纪70年代由美国最先发展的一项飞机系统设计新技术。设计师一开始就保证飞机本身具有足够的稳定性,良好的飞行性能和操纵性。CCVUF-16计划导致了世界上第一架真正的以主动控制技术设计的高性能战斗机F-16的诞生。直至今日,它仍是最优秀的战斗机之一。

主动控制技术之一是放宽静稳定性,即把飞机的静稳定性设计得比正常要求值更小,然后用控制系统对其进行监控,提高稳定性,是通过控制达到动态稳定性的方法。

主动控制技术的最基本的技术是机动载荷控制。它是根据具体飞行状态,用最优程序控制襟翼偏转,重新分布机翼上的载荷,使其具有理想的分布特性。

直接力控制是主动控制技术的又一重要技术。这种控制是通过一些附加操纵面,在不改变飞机迎面角情况下,使飞机的总升力发生变化,达到向上“平移”的目的。

主动控制技术还包括线控制,即提高飞机飞行的迎角、速度、过载的范围;综合飞行—推力控制,即采用变几何形状进气道以及具有推力矢量控制和反推特性的发动机诸方案,使推力和气动力达到一定的相互作用;综合飞行—火力控制,把飞行参数与火力控制系统参数协同处理,由计算机发出最佳攻击指令。

战争确实推动了航空技术的进步,但持久的动力还是民用商业航空。

波音公司成立于1916年7月15日。1952年4月波音公司研制成功B-52重型轰炸机,1957年1月用45小时19分完成了第一次环球不着陆飞行。B-52研制成功,使波音公司坚信喷气推进技术是民用客机发展的方向。1955年7月开始生产B-707,以后又有B-707-120(载客181名)、707-320(载客189名),1959年10月10日从纽约不着陆飞往伦敦,航程5 000千米。接着推出727,可在1 480米的跑道起飞。接着,1964年2月有727-100,载客131人,1967年有727-210,载客189人,又有737问世。

道格拉斯公司也是实力雄厚的公司,甚至早期超过波音,到了1966年,道格拉斯在财政上遇到了严重困难,1967年1月13日,麦克唐纳公司买下了道格拉斯公司,改名麦道公司。但新公司不走运,1975年5月25日,美国航空公司的一架DC-10在芝加哥坠毁,机上273人无一生还!美国联邦航空属下令DC-10飞机全部停飞!但后来调查表明,DC-10是性能很好的飞机,事故主要出在管理上。美国还有一家路克希德公司。这三大公司经常处于激烈的市场竞争中。

此外,欧、美之间的竞争也十分激烈。1974年,欧洲空中客车A300B交付使用,1979年A300B订货300架。

同时,苏联在民航方面也是有竞争力的。

航空技术在20世纪得到飞速发展,数学技术在其中起了核心的作用。由此也可看出,航空技术在本质上是数学技术。

(11)语言学中的数学技术

从人类开始用语言作为社会信息传递方式以来,又发明了文字,并以纸为载体,使人类进入了文明时代。印刷术发明后,使文字信息能大量地传播,进入工业化时代,文字又以电报、电传、电视数码、微胶片、光盘等方式存储传递,成为文字和其他信息的传递、传播的新载体。现在,计算机技术的高速发展,开始有了辅助人脑进行信息处理的工具,而要处理汉文字首先必须解决汉字进入计算机系统的问题。“汉字信息处理工程”就是为了解决这个问题的。计算机—激光汉字编辑排版系统已经国家鉴定批准定型,还通过了汉字情报检索系统的鉴定。汉字微机系统投入大量生产。这些系统建立的基础是要解决汉字的属性和使用频度规律,以便提供研制的数据基础。有关人员挑选86本书、104本期刊和7 075篇论文共2 000余万字的出版用字进行统计排队,首先选出出现概率为99.5%的3 000余字作为常用字,使其进入内存进行快速处理,使计算机效率大大提高。同时按一级字(最常用字)500个,二级字(常用字)500个(这1 000字就占全部出版及日常应用的90%),三级字(次常用字)500个,四级字(稀用字) 1 500个分区存储,增强了字库存储的合理性。一至四级字共约3 000字,占出版及日常用字的99.5%。掌握汉字的频度,就是使用的统计技术。

统计技术作为研究语言学的工具在20世纪初就已开始。马尔柯夫于1913年用概率统计方法研究过普希金的诗体长篇小说《奥湟金》中俄文字母的序列。现在主要是用统计技术研究破译密码。根据对密码报文中各字符的统计,采用一系统数学技术,可以尽快地破译。这项技术还可以用于文字考古学。例如将其用于美洲马雅文和古希腊线条文字的释读,就获得了相当大的成功。根据统计结果,汉字的信息熵值为9.51比特,汉字音节的信息熵值为7.56比特,汉字词汇的信息熵值为10.12比特。根据中文编码的基本定理,字符的信息熵值,应等于字符最佳编码的平均长度。

有人对《红楼梦》的作者问题从统计学的角度进行了研究。研究者从47个虚字(包括之、其、或等13个文言虚字等)角度,发现《石头记》成书于1732年前后,约30万字,作者可能是曹寅的侄儿;曹雪芹年轻时著有《金瓶梅》式小说《风月宝鉴》;1745年左右,曹雪芹开始对《石头记》“披阅十载,增删五次,分成章四”;1790年前后,完整的120回抄本《红楼梦》终于完成,并流传到社会上。因此,研究者认为,《红楼梦》前80回是曹雪芹根据《石头记》增删而成的,其中增插入他早年的小说《风月宝鉴》,并增写了具有深刻内涵的许多内容。《红楼梦》后40回是曹雪芹亲友搜集整理他的原稿后加工改写而成。

计算机的信息处理,要求人们对语言学概念进行严格的逻辑分析,提出精确的语言模型,并使其成为一个演绎系统。这样把语言学抽象成一般符号系统。语言的客观事实经过语言模型的抽象数学描述之后,就更适合于计算机处理了。这种数学技术描述的方法称为代数语言学。语言模型有分析型和综合型。综合型又称生成模型。把分析模型和综合模型结合起来即得到辨识模型。如果从已知的一个语言集合出发,分析它的语句结构、组成元素及其相互关系,亦即找出一组语法现象是用词汇集合中元素(词)的数学支配关系,恰当地刻画词的组合能力和形态变化。该型又用数学的“构形”来描述“句法”。数学的“构形”正是这种依存关系的抽象。图论的“树”正好可以完成这样的任务。

生成模型由于数学家乔姆斯基(N.Zhomsky,1928年生,美国人)的贡献,已在转换生成语法方面取得了突出成就。该型是指从已知的一组语法规则生发,研究这个形式语法所生成的某一语言集合的性质。乔氏把语言模型看做是数学上的某种算法过程。它由一套给定的初始元素,根据一定的语法规则,生成这些元素的序列。乔氏将语法分成四类:一是无限制的语法,称为0型语法;二是与前后符号有关的语法,称为I型语法;三是与前后符号无关的语法,称为Ⅱ型语法;四是有限状态的正则语法,称为Ⅲ型语法。计算机的高级语言如Algol、Fortran、Cobol等都等价于乔姆斯基的Ⅱ型语法。这是代数语言学的一个重要成就。Ⅲ型语法在模式识别中也得到有效应用。

为了研究语言的“表层结构”和“里层结构”的关系,于是形成了算法语言学。它认为语言是由一系列层次组成的。每个层次都有一定的结构形式,各层次之间都有一定的对应关系。如语声序列、音位序列、词汇序列,都是语言的层次。它们之间有什么关系?把里层结构作为一种抽象的符号系统来处理,一般用图论中的“树形图”作为分析表达的工具。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈