7.2.2 提高网络教学资源搜索的技术
搜索引擎搜索相关资源是通过匹配关键字来找到目标资源的,因此合理使用关键字就成了提高搜索成功率的关键。
1.关键字策略
关键字越少,符合条件的网页就越多,查全率越高,但结果就不够精确;反之则缩小了搜索范围,提高了查准率,但会把可能的网站排除在搜索结果外。关键字使用的总体策略包括:
(1)使用尽量少的细化关键字。所谓细化的关键字就是使用与主题尽量贴近的字词或术语。使用少的关键字目的是为了提高查全率,而细化的关键字可以提高查准率。
(2)使用空格合理切词。中英文在词语排列上的差异(英文词与词之间有空格隔开,而中文则没有),使得搜索引擎必须要进行切词工作。虽然目前支持中文搜索的引擎在切词方面已做得相当出色,但也不可能求其完美无缺。因此在搜索关键词较多的情况下,建议手动将中文字词之间用空格隔开,以避免长词造成的切词困难。
避免使用一些功能词汇和太常用的名词,如英文中的“and”、“how”、“what”、“web”、“homepage”和中文中的“的”、“地”、“和”等词,搜索引擎是不支持的。这些词被称为停用词(Stop Words)或过滤词(Filter Words),在搜索时这些词都将被搜索引擎忽略。
2.关键字语法
不同的搜索引擎对关键字的语法有所区别,但以下基本语法是以上几种搜索引擎所公用的:
(1)必须包含的多关键字之间直接用空格隔开。例如,如果要搜索中学语文教案可以使用“中学语文教案”这样的关键字,表示网页中必须同时包含“中学”和“语文教案”关键字。
(2)指定搜索网站。利用site关键字可以把搜索限制在特定的网站地址中。由于商业搜索引擎具有更强的关键字组合检索能力,可利用该方法实现对某些大型网站的特定资源的检索。其中,网站地址一般要去除WWW,因为网站一些资源的URL并不是以WWW作为域名。例如,新浪网的博客资源地址为blog.sina.com.cn。如果我们搜索某条评论,关键字就应为“某评论site:sina.com.cn”。这就包含了www.sina.com.cn和blog.sina.com.cn。
(3)精确匹配——双引号与书名号。关键字(特别是中文关键字)加上双引号之后,表示搜索结果必须完全精确匹配关键字。
(4)指定文件类型。通过使用filetype关键字,指定资源文件类型.例如我们希望搜索完整的教案文档,由于国内中小学的教案大多为Word文件,用“教案file‐type:doc”关键字可以排除许多无关信息。另外,Word、PDF文档往往质量比较高,垃圾信息较少,对提高搜索的精确度很有帮助。
以上关键字语法是通用的,还有一些搜索语法在各个搜索引擎间有所区别,常用的是表示几个关键字之间“或”关系的语法。“或”关系是指在几个关键字之中,只要有一个符合,就被检索返回。搜索引擎用两种方法来表示关键字之间“或”的关系。例如,我们要搜寻有关中学英语的课件或教案,那么不同搜索引擎间关键字的写法见表7‐2。
表7‐2 不同搜索引擎中关键字“或”关系的表示方法
在Google和必应中用大写英语字母OR连接前后关键字,OR前后有一空格。而百度和搜狗用“|”隔开(“|”符号输入方法为Shift+\),并且“|”与前后关键字之间没有空格。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。