首页 理论教育 网上检索概述

网上检索概述

时间:2023-03-04 理论教育 版权反馈
【摘要】:它既是一个多媒体的通信媒介,又是一个无限的信息资源。该网络由信息产业部下属的吉通通信有限公司规划、建设和运行。它采用卫星和光纤通道,目前已在全国24个省市联网,并与CSTNET和CERNET及国家信息中心连通。

10.1 网上检索概述

10.1.1 Internet的出现和发展

Internet是一个全球性的计算机互联网络。在中国一般译为“互联网”或“因特网”,在中国台湾和其他中文地区也有译成“国际网”或“交互网络”。它既是一个多媒体的通信媒介,又是一个无限的信息资源。它由几万个不同规模的网络通过自愿原则,主要采用TCP/IP协议互相链接起来,没有任何机构完全拥有Internet,也没有任何一家公司可以称为Internet公司。现在Internet已经进入了人们生活的方方面面,改变着人们的工作和生活方式。可以说Internet是人类历史发展中的一个伟大的里程碑,它是未来信息高速公路的雏形。

1969年由美国国防部资助,由高级研究项目署开始实现ARPANET计划,其目的是建立分布式的、灵活力极强的全国性信息网络。这就是Internet的雏形。1972年由50所大学和科研机构参与链接的Internet最早的模型ARPANET(即“阿帕网”)第一次公开向人们展示。1980年ARPANET成为Internet最早的主干。20世纪80年代初,两个著名的科学教育网CSNET和BITNET先后建立,1984年美国国家科学基金会NSF规划建立了13个国家超级计算机中心及国家教育科技网(NSFNET),替代了ARPANET的骨干地位。20世纪90年代初,商业机构进入Internet,使Internet进行商业活动有了可能,1995年NSFNET停止运作,Internet彻底商业化。

Internet在中国起步较晚,但发展很快。1986年中国建设了第一个计算机网络——中国学术网(China Academic Network,简称CANET)。1990年10月正式在国际互联网中心的前身DDNNIC注册登记了中国的顶极域名CN,用位于欧洲的计算机做网关和域名服务器来接入Internet。1993年3月,中国科学院高能物理研究所租用专线接入欧洲,成为中国大陆第一个Internet节点。1994年5月由中国科学院主持,联合清华大学、北京大学,在中国科学院计算网络中心建立了NCFC(the National Computing and Networking Facility of China),它是中国国家计算机与网络设施,又称中关村地区教育科研示范网NCFCnet,并完成了中国最高域名(CN)主服务器的设置,通过中国科学院网络中心实现了与Internet的TCP/IP链接,这标志着中国正式加入了国际互联网的行列。随着CERNET(中国教育和科研计算机网)、ChinaNET(中国公用计算机互联网)、CSTNET(中国科技网)和ChinaGBN(中国金桥网,现并入中国网通公用互联网CNCNET)四大互联网的开通,使我国Internet主干网具备了相当的规模,发展和应用步伐紧跟世界节奏。

10.1.2 中国四大互联网络

(1)中国科技网CSTNET。中国科技网的前身是NCFC,即北京中关村地区教育和科研示范网,以后发展为CASNET,即中科院和其他研究所的全国性网,CSTNET是在此基础上建立的,1994年该网实现了与Internet的链接,它的中心在北京中科院计算机网络信息中心(CNNIC)。目前,中国科技网在全国范围内已接入农业、林业、医学、地震、气象、铁道、电力、电子、航空航天、环境保护和国家自然科学基金委员会、国家专利局、国家计委信息中心、高新技术企业,以及中国科学院分布在京区和全国各地45个城市的科研机构,共1000多家科研院所、科技部门和高新技术企业,上网用户达40万人。中国科技网的服务主要包括网络通信服务、域名注册服务、信息资源服务和超级计算服务等,它的科技信息资源有科学数据库、中国科普博览、科技成果、科技管理、技术资料、农业资源和文献情报等,其中科学数据库现有专业数据库180个,总数据量达725GB,可以向国内外用户提供各种科技信息服务。

(2)中国教育科研网CERNET。中国教育科研网的全称是China Education and Research Network,它是国家教委主持的国家重点工业性研究项目。工程由清华大学、北京大学、北京邮电大学、上海交通大学、西安交通大学、华中科技大学、华南理工大学、电子科技大学、东南大学、东北大学等十所院校共同承建,于1994年启动,1995年12月正式开通运行,并实现与Internet的全方位链接。目前CERNET建成了总容量达800GB的全世界主要大学和著名国际学术组织的10个信息资源镜像系统和12个重点学科的信息资源镜像系统,以及一批国内知名的学术网站,并建成了系统容量为150万页的中英文全文检索系统和涵盖100万个文件的文件检索系统,是我国开展现代远程教育的重要平台。CERNET的建设,加强了我国信息基础建设,缩小了与国外先进国家在信息领域的差距,也为我国计算机信息网络建设起到了积极的示范作用。

(3)中国公用计算机互联网CHINANET。中国公用计算机互联网是我国第一个全国性商业网,它由中国信息产业部经营管理,于1994年开始启动。CH INANET使用TCP/IP协议,通过高速数据专线实现国内各节点互连,拥有国际专线,是世界INTERNET的一部分。用户可以通过电话网、综合业务数据网、数字数据网等其他公用网络,以拨号或专线的方式接入CH INANET,并使用CH INANET上开放的网络浏览、电子邮件、信息服务等多种业务服务。CH INANET也已成为中国规模最大,技术、业务发展最快的公用数据网之一。

(4)中国金桥信息网。中国金桥信息网CH INAGBN是三金工程(金桥工程、金关工程、金卡工程)之一,也称中国经济网,于1996年开始建设,它是国家经济信息通信网,提供Internet网络商业服务。该网络由信息产业部下属的吉通通信有限公司规划、建设和运行。它采用卫星和光纤通道,目前已在全国24个省市联网,并与CSTNET和CERNET及国家信息中心连通。CHINAGBN实现跨地区的数据、图像及语音的传输,并提供Internet的链接和信息服务。

中国这四大网络于1997年10月实现了互联互通,因此构成了中国计算机网络的骨干网络,覆盖了从国民经济到家庭生活的各个方面。根据2006年1月中国互联网络信息中心(CNNIC)发布的《第十七次中国互联网络发展状况统计报告》,截止到2005年12月31日,我国的上网计算机总数已达4950万台,上网用户总人数为1.11亿人,网站数达到69.4万个,国际出口带宽的总容量为136106M,IP地址总数达到739万个。

10.1.3 Internet网络架构

Internet中,一些超级的服务通过高速的主干网如光缆、微波或卫星相连,而一些较小规模的网络则通过众多的支干与这些巨型服务相连。对于利用调制解调器接入互联网的个人用户来说,进入Internet需要通过网络服务商ISP来实现。ISP即是个人电脑进入Internet的入口。普通用户通过一台接在电话线上的调制解调器与ISP相连,借助ISP接入互联网。网络上的用户是平等的,无地域、职位的限制,也没有电脑型号的差别。互联网各主机之间的物理连接是利用常规电话网、高速数据网、卫星、微波或光纤等各种通信媒体来实现的。

10.1.4 Internet的域名管理与IP地址分配

在网络上要同其他用户和计算机打交道必须知道地址,TCP/IP协议中的IP为Internet上的计算机提供了地址。Internet上的地址有IP地址和电子邮件地址两种。Internet的IP地址32位,可用4个十进制数字表达,数字间用“·”隔开(如: 59·64·82·5)。IP地址分为A、B、C三类。A类地址提供给大型网络使用,第一个数字为网址,后三个数字为网内主机地址; B类地址提供给中型网络使用,网址与主机地址各占两个数字,B类节点地址可供65000多个用户使用; C类地址供小型网络使用,前三个数字为网址,后一个数字为主机地址。

从表面上看,Internet地址有两种形式:一种是机器可以识别的地址,用数字表示,如地址是: 211·82·123·100;另一种是人可以看懂的,用字母表示,如地址: www.sohu. com。

为了便于网络地址的分层管理与记忆,其结构为“主机名·机构名·网络名·最高级域名”。域名在整个Internet中是唯一确定不变的,当一名主机从一处移到另一处时,当它属于不同的网络时,其IP地址必须更换,但可以保留原来的域名,下表是主要的最高级域名列表,默认值为美国。

img87

10.1.5 Internet的基本服务功能

Internet为用户提供了高速快捷的信息交流渠道和丰富的信息资源。同时为用户提供了多样化的信息服务。主要有:电子邮件(E-mail)、远程登录(Telent)、文件交换(FTP)、网络新闻(GroupNews)、WWW信息服务、Gopher信息服务、Archie信息服务等。

(1)电子邮件(E-mail)。电子邮件是Internet最主要的,也是应用最广的功能之一,它是一种通过计算机网络接收和发送信件的手段。目前Internet提供的E-mail服务已不仅仅局限于一般信件的传递,还能实现以下功能:

1)可同时向多个收信人发送同一信件;

2)传送包括文件、声音、影像和图形在内的各种信息;

3)向Internet以外的网络用户发送信件;

4)向一台计算机发送信件,由程序自动对信件内容进行处理;

5)获取有关的原始文献或专利文献。

(2)远程登录(Telent)。远程登录(Telent)服务也是Internet最常用的功能之一,它允许用户从本地主机上对远程计算机进行账号注册。注册成功后,在远程登录通信协议Telnet的支持下,使自己的计算机成为远程计算机的一个仿真终端,共享远程计算机上的软硬件资源。要在远程计算机上登录,先与远程机器的系统管理员联系,申请账号、密码,然后使用Telnet服务将自己的机器链接到远方主机,登录时,应给远程主机的域名或IP地址,然后根据提示输入相应的账号和密码,登录成功即可使用远程主机对外开放的功能和资源。

Internet上的一些服务可以通过远程登录来得到,如果用户没有archie或gopher的客户程序,又想使用这些功能,就可以Telent链接到某台提供archie或gopher的电脑为账号注册。这种情况下通常不需要password,进入远方服务器后,用户便可以获得相应的服务。

(3)文件交换(FTP)。尽管在Internet上,电子邮件可能是使用最广泛的应用程序,但是数据的传输大多要通过文件传输协议(FTP)。FTP程序可以实现文件在主机间及主机与用户间的传送。这样不但能为用户节省时间和费用,还可以使用户自由、方便地收集Internet中提供的各类信息的数据文件,从而更从容地阅读和处理这些信息资料。FTP是一种实时的联机服务,工作时用户首先要登录到对方的计算机上,普通的FTP服务要求用户在登录到远程计算机时提供相应的用户名和密码,如果没有在某个主机上注册,即没有用户名和密码,则不能与该主机进行文件传递。为了方便用户对文件的操作,很多系统允许用户以匿名方式进入系统上传或下载文件,这种匿名FTP操作成为Internet上最受欢迎的服务。

目前,www的超文本传输协议(HTTP)已经代替了FTP的大部分功能,可以实现从远程主机复制文件到本机,但上传不行,只有FTP可以将文件从用户计算机复制到服务器计算机。通过FTP使用的文件是任意格式的。例如文档文件、多媒体文件、应用程序文件、声音文件、图像文件、数据压缩文件等。

(4)网络新闻服务(GroupNews)。网络新闻通常又称GroupNews,目前流行的另一种新闻组形式是BBS。它是具有共同爱好的Internet用户相互交换意见的一种无形的用户交流系统,它相当于一个全球范围的电子公告牌系统。网络新闻是按照不同的专题组织的。志趣相同的用户在网络上用被称为新闻服务器的计算机来展开各种类型的专题讨论。

网络新闻不同于邮件用户组,虽然通过加入邮件用户组可“订阅”消息、参加讨论,但用户必须付出一定的代价:定期阅读从用户组收到的大批邮件,若用户加入多个邮件用户组时,每天阅读和处理邮件成为用户的沉重负担。而网络新闻组是一种供用户自由参与的活动,用户参加时不用申请并可自由退出。只要用户计算机装有一种“新闻阅读器”的程序,就可以通过Internet随时阅读新闻服务器提供的分门别类的消息,并可以将用户见解提供给新闻服务器作为一条消息发送出去。

(5) www信息服务。www是当前Internet网上最受欢迎、最流行,也是最有发展潜力的信息检索服务系统。它通过Hyperlink(超链接)技术将全球的信息资源以Hypertext(超文本)的方式链接起来,构建虚拟世界中的“地球村落”。www基于Internet的查询、信息分布和管理系统,是人们进行交互的多媒体通信动态格式,它提供了搜寻信息的一种途径,帮助在Internet上通过简单的操作去获取不同地点、不同存取方式的信息资源。www服务采用了超文本与超媒体的技术,以多媒体的形式向用户展示丰富的信息,并通过超文本和超媒体的链接功能,直观地引导用户获取所需信息。它的正式提法是:“一种广域超媒体信息检索原始规约,目的是访问巨量的文档资料。www已经实现给计算机网络上的用户提供一种兼容的手段,以简单的方式去访问各种媒体。”

(6) Gopher信息服务。Gopher是基于菜单驱动的Internet信息查询工具。Gopher的菜单项可以是一个文件或一个目录,分别标以相应的标记,对于目录可以继续跟踪进入下一级菜单,如果是文件则可以通过多种方式获取,如邮寄、存储、打印等。在逐级菜单的指引下,用户通过选取自己感兴趣的条目,对Internet网上远程联机信息系统进行实时访问。Gopher内部集成了Telnet、FTP等工具,可以直接取出文件,而无须知道文件所在及文件获取工具等细节,是一种深受用户欢迎的Internet信息查询工具。

(7) Archie服务。Archie是Internet信息资源的一种检索,它提供一种在Internet上以匿名FTP文件信息查询为目的的电子目录服务。在一定的时间间隔内,Archie系统与Internet上所有已知的匿名FTP主机建立链接,并把这些存有公开文件的主机目录的完整清单存入自己的数据库中。当用户寻找某个文件时,只需提供所需查找的文件名或部分文件名给Archie服务器,通过搜索,Archie服务器就可以反馈存有该文件的FTP服务器地址及具体路径。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈