首 页 - ┆ 小小说社会科学搜榜改进建议哲学宗教政治法律文化科教语言文字医学管理资源艺术资料数理化天文地球专业技术教育资源建筑房地产
当前位置:e书联盟 > 医学 > 医药 > 医学ppt
计算机检索基础知识.ppt
运行环境:Win9X/Win2000/WinXP/Win2003/
医学语言:简体中文
医学类型:国产软件 - 医药 - 医学ppt
授权方式:共享版
医学大小:290 KB
推荐星级:
更新时间:2019-12-27 21:06:41
联系方式:暂无联系方式
官方主页:Home Page
解压密码:点击这里
  • 好的评价 此医学真真棒!就请您
      0%(0)
  • 差的评价 此医学真差劲!就请您
      0%(0)

计算机检索基础知识.ppt介绍

一、计算机信息检索基本原理二、计算机检索步骤1、分析研究课题分析研究课题的主题内容、所属学科,然后分析出主题概念、提取关键词和分子式、号码等作为检索词,再确定课题所需查找文献的时间范围、国家范围和文献类型范围。2、关键词的抽取在分析了课题后,可以进行关键词的抽取,滤除一些虚词、禁用词后,将剩余的词作为关键词。制定关键词时还须考虑同义词、不同的拼写方法、单复数形式、常用缩写词语和其完整词语,即同一概念的检索词的扩展。3、选择检索工具(数据库)确定和学科专业有关的、以及和所查文献类型有关的数据库。一些常用的国内外科技综合类数据库中国期刊网中国科技期刊数据库万方数据检索系统中华人民共和国国家知识产权局Ebscohost 全文数据库Ei village 工程索引SCI 科学引文索引ISTP 科学技术会议索引Derwent Innovations Index  世界专利索引INSPEC  英国科学文摘Cambridge Scientific Abstracts 剑桥科学文摘STARDARDS & SPECIFICATION 美国标准和规范4、构建检索式根据课题分析的结果,将检索词用布尔逻辑、及数据库系统使用的检索算符组成检索表达式。三、检索策略构成和调整方法检索策略的制定过程可以简单地理解为检索表达式的形成过程,以提高检索的查准率和查全率。制定检索策略主要应用到:1 、布尔逻辑算符2 、截词算符3 、位置算符1、布尔逻辑算符规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑“与(AND )”、“或(OR )”和“非(NOT )”。以提问式“communication AND satellite”检索为例:    图2逻辑“与”示意图这个实例的示意图,图中的阴影部分反映了“communication”和“satellite”两词间使用AND 算符后的运算结果。(2)逻辑或(OR ,也可用“+”代替)表示主题概念之间的同义、近义、相关或多个并列的检索概念。其含义是,检出的记录中,至少含有两个检索词中的一个。OR 算符的基本作用是扩大检索范围。其检索结果如图所示:以提问式检索“西红柿”有关的文献为例:    图中所有部分都为检索结果,因此OR 算符的基本作用是扩大了检索范围,防止漏检。OR 逻辑关系运算对所检的主题概念起到了概念的外伸作用。例如:检索“PATENT not GERMAN”,检索结果示意如下:优先处理算符“()”  逻辑算符OR 和AND 的使用方法,如果归纳成一个模式,比如有A 、B、C、D四个检索词(其中A和B,C和D分别为同义概念),检索提问式为:    (A OR B )AND (C OR D )  即,同一组检索提问既含有OR 算符,又含有AND 算符,此时须使用优先处理算符“()”,将OR 算符前后的词放入括号中,计算机将优先运算括号内的算符。2、截词算符(截词符号为*或?)此算符可看作是将某一部分相同的检索词用“或”算符连接后进行检索。不同数据库有不同的截词符,如EI_Village2 用?,而Web of knowledge 平台用*。基本作用是,减少输入步骤,简化检索程序,扩大检索范围,提高查全率,提高检索效率。一般可分为后截断、前截断、中间截断、混合截断四种。(1)后截断(开放式截断)  后截断可保持词首部分的一致性。如:computer? 或computer*, 可实现:computer , computerised , computerized , computers …的检索(2)前截断前截断可保持词尾部分的一致性。如: ?computer , 可实现:microcomputer ,  minicomputer…的检索(3)中间截断(嵌入式截断)  中间截断可实现对某词不同拼法的检索,嵌入字母数等于问号数,通常用在英美不同拼法。如:computeri?ed , 可实现:computerised ,  computerized …的检索(4)混合截断混合截断可以实现对不同词根、词首、及中间部分不一致的检索。如:?computer? , 可实现:computer ,  computerized , computers , microcomputer , microcomputerized , minicomputer …的检索3、位置算符  位置算符又称邻接算符(adjacent operators ),适用于两个检索词以指定间隔距离或者指定的顺序出现的场合,比如,以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词以及化学分子式等。位置算符是调整检索策略的一种重要手段。  常用的位置算符有N 或near 、W 等。各个检索系统中的位置算符的表示方法有所不同。下面介绍的以Ei COMPENDEX 数据库使用的位置算符为例。4、字段限制(TI,AB,DE,ID) A. 基本字段限制  基本字段限制的用法是在需要指定字段(题目、叙词、识别词和文摘)的检索词后加上后缀运算符“/”和段码。例如,检索策略“OPTICAL/TI AND FIBER/TI”的含义是指定在题目字段中查找含有“optical”和“fiber”两词的所有记录。字段段码可以多个连用,段码之间加“,”即可。例如,检索策略“FIB?/TI,DE”的含义是指定在题目和叙词字段中查找以“fib”为词干的所有记录。B. 辅助字段限制 辅助字段运算符的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符“=”。例如检索策略AU=“Robert, S.”的含义是在作者字段中查找含有“Robert, S.”的所有记录。下面是其他常用的辅助字段限制及其实例:指定著者单位字段CS=SHANGHAI UNIVERSITY 指定刊物名称字段JN=APPLIED MATHEMATICS  指定语言字段LA=ENGLISH 指定文献类型字段DT=JOURNAL 5、检索策略的调整  检索表达式输入检索系统后,输出的检索结果有时不一定能满足课题的要求,或者检出的篇数过多,而且不相关文献所占比例很大,或者检出的文献数量太少,有时甚至为零,这时就需要调整检索策略。调整检索策略之前,首先要分析造成结果不理想的原因。对于输出篇数过多的情况,应分析是否可能是如下原因造成:a . 选用了多义性的检索词;b . 截词截得过短;c. 输入的检索词太少;d. 应该使用“与(AND )”的使用了“或(OR )”;e. 优先运算符“()”使用错误。    针对上述原因,如果是属于需要扩大检索范围,提高检索结果查全率的,调整策略的方法有:a. 减少“与(AND )”算符,增加同义词或同族相关词用逻辑或(OR )将它们连接起来;b.  在词干相同的单词后使用截词符(?或*);c. 去除已有的字段限制、位置算符限制(或者改用限制程度较小的位置算符)。如果是属于缩小检索范围,提高检索结果查准率的,调整策略的方法有:a. 减少同义词或同族相关词;b. 增加限制概念,用逻辑与(AND )将它们连接起来;c. 使用字段限制;d. 使用适当的位置算符;e. 使用“非(NOT )”算符,排除无关概念。对于输出篇数过少的情况,应分析是否方式如下原因造成:a. 检索词拼写错误;b. 遗漏重要的同义词或隐含概念;c. 检索词过于冷僻具体;d. 没有使用截词算符;e. 位置算符和字段算符使用的过多;f. 使用过多的“AND”算符。计算机检索基础知识主要内容:  计算机信息检索基本原理;计算机检索步骤;检索策略构成和调整方法。武汉工程大学图书馆文献检索教研室取出过程:文献信息检索标识数据库情报需求检索式检索结果存入过程:标引规范化存储检索匹配运算得到检索过程中的具体步骤: 指在分析信息需求实质的基础上,确定检索工具、检索途径与检索用词,并明确各词之间的逻辑关系。在检索过程中具体的步骤如下:(1)逻辑与(AND ,也可用“*”代替)  组配用来表示不同检索主题概念之间的相交。其含义是检出的记录必须同时含有所有的检索词。AND 算符的基本作用是缩小检索范围,提高检索结果的查准率。其检索结果如图所示:番茄西红柿(3)逻辑非(NOT ,也可用“-”代替)  在检索时建议使用NOT ,以避免与词间的分隔符“-”混淆,NOT 算符是排除含有某些词的记录的,A NOT B 检索出的文献中包含A的主题概念,而不含B主题概念。NOT 算符的基本作用是缩小检索范围,提高检索结果的查准率。其检索结果如图所示:(5)限制式截断(1)词干后只跟一个字母,用? ? 表示,两问号间空一格。主要用于单、复数名词的检索。 例:DYE? ? 表示检索DYE 、DYED 、DYES 。(2)词干后至多跟与问号数相同的字母数,用?? 或??? 表示,问号间不用空格。例:UNIVERS?? 表示最多跟2个字母,可检索UNIVERSE 、UNIVERSAL 等。例:CAND??? 表示最多跟3个字母,可检索CANDY 、CANDIES 、CANDIED 等。  以AND 运算符查得的记录中,尽管同时含有所希望的检索词,但AND 算符并不限制两个检索词的位置和出现顺序。以“communication AND satellite”这个策略为例,命中的文献中可能既含有“communication satellite”,又含有“satellite communication”;也可能既含有“communication devices for satellite”,又含有“communication links without satellites”, 显然其中的有些记录与课题要求毫无关系。位置算符可以用于改进AND 运算符这种不足之处,因此,它们可以看成是特殊功能的AND 运算符。算符实例解释NEAR Bridge  NEAR  Piling  所检出的文献要同时含有这两个词,这两个词要彼此接近(间距不超过5个词),前后顺序不限。W/n Pig  W/2  pine  检出的文献要同时含有这两个词,两个词的间距不能超过n个单词,前后顺序不限。Adj Channel  adj  tunnel  检出的文献要同时含有这两个词,两个词相邻,位置一定而对于EBSCO 数据库:W 算符表示在此算符两侧的检索词在命中时,必须按输入时的先后次序排列,不得颠倒顺序。两个检索词之间可以插入任何其它的词和字母(但可以有一个空格或一个符号连接号),相隔的词数用W加数字表示,即nW 或W/n 。可见,检索用户要想用一个固定的词组检索,也可采用(W)算符,如:thin(W)film 等。  N 算符表示在此算符两侧的检索词在命中时,词序可以颠倒。检索词之间允许插入任何其它的词和字母,相隔的词数用N加数字表示。

下载此电子书资料需要扣除0点,

电子书评论评论内容只代表网友观点,与本站立场无关!

   评论摘要(共 0 条,得分 0 分,平均 0 分) 查看完整评论

下载说明

* 即日起,本站所有电子书免费、无限量下载下载,去掉了每日50个下载的限制
* 本站尽量竭尽努力将电子书《计算机检索基础知识.ppt》提供的版本是完整的,全集下载
* 本站站内提供的所有电子书、E书均是由网上搜集,若侵犯了你的版权利益,敬请来信通知我们!

下载栏目导航

Copyright © 2005-2020 www.book118.com. All Rights Reserved