第一节 互联网基础知识
一、互联网技术举要
(一)IP地址及域名
IP地址是互联网标识上网主机地址的编号,目前有IPv4和IPv6两种形式的IP地址。IPv4协议规定的IP地址长度为32位,由4组小于256的十进制构成(如:202.38.185.67),根据IP地址我们可以定位主机的位置,前面所举的IP地址就是北京邮电大学图书馆技术部的一台主机。IPv6协议规定的IP地址长度为128位,可扩展的余地更大,今后将逐步采用IPv6的IP地址。
域名(Domain)是为了便于记忆而产生的与数字IP地址对应的字符型IP地址。域名由域名管理系统(DNS)统一维护和管理,需要注册后方可使用。典型的域名由4个部分组成,例:www.fudan.edu.cn。从左至右4段依次为主机名、三级域名、二级域名和顶级域名,其顶级域名为国别顶级域名。也有的域名只有3个部分,例:www.nih.gov。此类域名的顶级域名是网络类别代码。网络类别顶级域名表示主机所属的网络性质,这是由互联网国际特别协会(IAHC)指定的,如商业组织(com)、教育机构(edu)、政府部门(gov)、学会社团等非营利组织(org)、信息机构(info)等。根据网络类别,我们可以判断网站的性质,信息来源的可靠性。二、三级域名和主机名可以由网站自己命名。
(二)万维网(World Wide Web,WWW,Web)
万维网是基于超文本传输协议(http协议),通过含有超级链接的超文本(Hypertext)方式来进行网上信息浏览的工具。
1.统一资源定位器(URL) 又称“网址”,是信息在网上的地址,用来定位和检索万维网上的网页和文件。它由web服务器域名、文件路径、文件名3部分组成,每部分之间用斜线(/)分隔。例如:http://www.shmu.edu.cn/library/content.htm。
2.网站与网页 所谓网页是指万维网的上网主机中提供访问的一个网页文件,通俗讲就是网络浏览器中显示的一屏网页页面。所谓网站是网页的集成,最小的网站可能只有一个页面,大部分的网站都有几十,甚至几千,乃至上万张网页组成。一般来说,网站是机构或个人用于介绍自己或提供服务的站点,也就是说,一个网站一般代表一个机构(或个人),进入这个机构(或个人)网站后显示的第一个页面为该网站的主页。我们通常可以用域名是否变化来分辨是否进入了新的网站。例如:复旦大学网站的主页网址为:http://www.fudan.edu.cn,进入主页上的“复旦新闻”栏目,其网址为http://www.fudan.edu.cn/fudannews/main.php,该网页的域名为.fudan.edu.cn,没有发生变化,因此仍在复旦大学网站上;点击复旦新闻网页上的图片链接,进入人民网主页,网址为http://www.people.com.cn,其域名为.people.com.cn,与原先的域名不同,因此已进入与复旦不同的另一个网站。
在搜索引擎中,如果要查找具体的文章、新闻、数据、实事等信息,往往使用网页检索;如果要查找本人研究领域重要学术站点等专业网站,则使用分类目录或网站搜索比较有效。
(三)Web 2.0
Web2.0是以Blog、TAG、SNS、RSS、Wiki百科等应用为核心,依据六度分隔、xml、ajax等新理论和技术实现的互联网新一代模式。伴随着Blog(网志、博客)等个人媒体的崛起,由网民集思广益,共同撰写的百科全书维基百科的诞生,相对于原先Web1.0的互联网而言,Web2.0是可以读写的互联网,它让互联网找回“互联网”的真正含义:平等、交互、去中心化。
(四)局域网代理服务器设置
复旦大学订购的绝大多数数据库都是使用IP地址来控制访问权限的,有的数据库在访问时还需要设置代理服务器,在我校学生公寓中使用数据库基本都要设置免费代理服务器。代理服务器可以在网络浏览器中设置,现以IE浏览器为例介绍设置方法。
在IE浏览器的“工具”下拉菜单中选择“Internet选项”→点击“连接”选项卡→单击对话框右下方的“局域网(LAN)设置”按钮→在代理服务器设置区域内勾选“为LAN使用代理服务器”→输入代理服务器地址和端口→点击“确定”即完成设置。
二、互联网信息的特点
互联网的海量信息资源与我们订购数据库中的信息以及传统的纸本文献相比有其自身的特点:
1.无序性 互联网的信息来源分散,没有统一的管理机构和发布标准,信息杂乱无序。网页的变化、更迭、新生、消亡等随时发生,难以控制,在搜索引擎中很可能一条信息被检索到后,在随后另一个时间却检索不到了。无序性是我们利用互联网信息中面对的最大挑战。
2.多样性 从文件格式上看,互联网的信息有文本、超文本文件,也有多媒体、动画、音频、视频文件,还有各种软件;从内容上看,可以是政府部门、研究机构、教育机构、公司企业、社会团体或者个人等任何用户发布的任何信息,涵盖各学科领域,包罗万象。
3.新颖性 相对于其他载体形式的信息来说,互联网的信息具有较强的新颖性和及时性,许多重要事件都会在网上实时播报,一些研究报告、调查采访、研讨会发言、笔记等会在个人博客、论坛等网络新媒体中第一时间被披露。
4.对话性 互联网提供了更多直接交流的机会。如在新闻组、讨论组、博客等上面可以浏览或直接参与焦点问题的讨论,或是发出求助信息,从而可以获得许多零次信息。
5.开放性 互联网提供了正式出版渠道之外的发表个人见解的空间,一些新观点、不成熟的观点、未成定论的理论、假说、概念等,一些研究笔记、演讲稿等都可以在网上自由发布,这些大量的灰色文献或边缘文献反映了许多原始数据和第一手资料,有着不容忽视的参考价值。另一方面,互联网的开放性也使信息内容的质量难以控制,一些垃圾信息、虚假信息充斥其中,因此在利用互联网信息时必须加强评价与鉴别。
目前而言,互联网信息资源确实难以取代传统信息源和订购数据库,但它是最有力的补充。对科研工作者来说,掌握利用互联网信息资源的方法,有助于把握领域发展的前沿。
三、互联网信息的评价与鉴别
对互联网信息资源的评价一般是以网页或网站为评价单位,结合网络信息的特点,其评价主要着眼于网页/网站所提供的信息内容质量和信息存取方式等,一般包括以下指标:
1.范围 包括网页所属性质(报道、教学、销售、官方、社团等)、覆盖的主题领域、面向的用户层次、信息的深度和时间范围、信息类型(事实性/评论性、原始信息/链接)等。
2.准确性 信息是否提供来源和出处以备核查;页面语言是否准确、严谨;是否明确列出该网页信息的编辑和提供等责任者;语气是客观性的还是广告性的;有否政治或意识形态因素的影响等。
3.权威性 主办者是否为可信赖的组织、机构、专家或学者;是否提供进一步联系、核实信息的方式(如E-mail地址等);是否有版权保护,版权的拥有者是否有明确说明等。
4.新颖性 指网页是否动态更新,即信息的提供时间、更新频率及最近修改日期。
5.独特性 指网页信息提供的优势,是否有特别的服务功能(如个性化网页设置)。
6.稳定性 网页能否较稳定、连续地接受访问,其连接及检索的速度是否正常;指向其他资源的链接是否明确、清楚且维护良好,无空链、死链等。
7.费用 互联网上的信息并非全是免费的,费用可分为连通费用和获取内容的费用两部分。连通费是指是否需要支付国际流量费等额外的上网费用。内容费用是指获取网站全文、评论等信息及其他服务是否要付费。
在医学和健康方面的网站评价中,健康网络基金会(HON)于1996年制定了HONcode(医学和健康网站网络道德准则),被翻译成英、中、法、俄等26种语言,已成为医学健康网站信息发布的国际伦理守则。全球医学健康网站可自愿加盟该组织,凡加盟网站必须严格遵从准则条款,并在显著位置标有HON标记。因此,在医学健康网站的评价中,有这一标志的网站其可信度较好。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。