单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,精选ppt,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,精选ppt,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,二级,三级,四级,五级,精选ppt,*,第二章文献信息检索技术,1,精选ppt,第二章文献信息检索技术1精选ppt,第一节文献信息检索技术,(一)检索方式,1,、,命令式检索:,用逻辑运算符、位置算符及其他检索符号,把不同的检索词连接起来进行检索的一个种方式,如数据库中的专业检索。适用于专业人员。,2,、,菜单式检索:,一种通过窗口菜单进行检索的简单、易操作的检索方式。现各数据库的高级检索、初级检索都属于菜单式检索,是最常用的检索方式,适用于一般读者检索。,3,、,导航检索:,点击检索界面上的超链接进行检索,也叫超链接检索。,2,精选ppt,第一节文献信息检索技术(一)检索方式2精选ppt,3,精选ppt,3精选ppt,4,精选ppt,4精选ppt,5,精选ppt,5精选ppt,分类途径,主题途径,关键词途径,题名途径,责任者途径,引文途径,第二节检索途径与检索语言,P25-26,检索途径 (检索项,检索点、检索入口,),1,6,精选ppt,分类途径第二节检索途径与检索语言 P25-26 检索,、检索语言:,用来描述检索提问主题、学科分类等内容的语言,它和检索途径是相对应的。,(P27),常见的检索语言有,主题语言,和,分类语言,。,检索语言的类型,表述文献外表,特征的语言,表述文献内容,特征的语言,题名,责任者,代码,引文,分类法,主题法,7,精选ppt,、检索语言:用来描述检索提问主题、学科分类等内容的语言,它,主题词是规范化的检索语言,主题词检索途径的检索系统都有相应的主题词词表,利用主题词途径标引或检索文献时,一定要先查对词表,再进行标引或检索。国内中文主题词表一般采用,中国主题词表,或,中国图书馆图书分类主题词表,,英文文献检索系统一般采用,美国国会图书馆标题表,。,主题途径,8,精选ppt,主题词是规范化的检索语言,主题词检索途径的检索系统都,根据分类语言进行检索的途径,它是一种按学科范畴和体系来划分事物的检索语言,以分类表的形式体现。国内文献分类一般使用,中国图书馆图书分类法,(简称,中图法,),.(P30),专利使用,国际专利分类法,(,IPC,)分类。国外分类法很多,比较常见的有,美国国会图书馆分类法,(,LC,)、,国际十进分类法,等,。,分类途径,9,精选ppt,根据分类语言进行检索的途径,它是一种按学科范畴和体系来划,马克思主义、列宁主义、毛泽东思想,哲学,社会科学总论,政治、法律,军事,经济,文化、科学、教育、体育,语言、文字,文学,艺术,历史、地理,自然科学总论,数理科学和化学,天文学,地球科学,生物科学,医药、卫生,农业、林业,工业技术总论,一般工业技术,矿业工程,石油、天然气工业,治金工业,金属学、金属工艺,机械、仪表工业,武器工业,动力工程,原子能技术,电工技术,无线电电子学、,电讯技术,自动化技术、计,算技术,化学工业,轻工业、手工业,建筑科学,水利工程,交通运输,航空、宇宙飞行,环境科学,综合性图书,中图法分类体系,返回,分类途径,10,精选ppt,马克思主义、列宁主义、毛泽东思想天文学,地球科学,以关键词进行检索的方式,关键词又称自由词,是从文献的题名、摘要和正文中抽出的具有实际意义的非规范化自然语言。,其优点是:,A,、简捷,降低对检索人员的要求;,B,、易用,易于计算机编制和检索;,C,、及时,能及时更新词汇。,关键词途径,11,精选ppt,以关键词进行检索的方式,关键词又称自由词,是从文献的题名、,缺点:,1,、不规范,有大量的同义词、近义词,影响查全率和查准率。如“高速公路”有”,highway”“autoroute”,,“,freeway”,,“,speedway”,,“,thruway”,等,“图形图像”和“图形图象”同义,检索时如果不能全部记住,会出现漏检;而“,cell”,既指细胞又指电池,检索时会出现误检。,2,、词汇量大,给存取带来困难。,由于关键词是未经人工干预的自然语言,符合大众的检索习惯,大多数检索系统都有关键词检索。,12,精选ppt,缺点:12精选ppt,题名途径:,根据文献名称包括书名、刊名、论文篇名等来检索文献的途径。,责任者途径:,指根据已知文献著者来查找文献的途径,包括个人著者和机关团体。,引文途径:,从被引文献去检索引用文献的检索途径。,13,精选ppt,题名途径:根据文献名称包括书名、刊名、论文篇名等来检,第三节计算机信息检索技术,(一)逻辑运算符,逻辑运算符又称布尔算符,是用来表达各检索词之间的逻辑关系的符号。,逻辑运算符有“与”、“或”、“非”三种,分别用“,and”,、“,or”,、“,not”,来表示,也可以用“*”“,+”“-”,来表示。,14,精选ppt,第三节计算机信息检索技术(一)逻辑运算符14精选ppt,1,、逻辑“或”,A,B,用符号“,or”,或“,+”,表示,其逻辑表达式为:,A or B,或,A+B,其意义为检索记录中凡含有检索词,A,或检索词,B,,,或同时含有检索词,A,和,B,的,均为命中文献。,例,:,15,精选ppt,1、逻辑“或”,2,、逻辑“与”,A,B,用符号“,and”,或“*”表示,其逻辑表达式为:,A*B,或,A and B,其意义为检索记录中必须同时含有检索词,A,和,B,的文献,才算命中文献。,例,16,精选ppt,2、逻辑“与”AB,3,、,逻辑“非”,A,B,用符号“,not”,或“,-”,,其逻辑表达式为:,A not B,或,A-B,其意义为:检索记录中含有检索词,A,,但不能,含有检索词,B,的文献,才算命中文献。,例,17,精选ppt,3、逻辑“,逻辑提问式(布尔逻辑组配):,计算机检索的基本技术,主要通过逻辑运算符(布尔算符)“与,(and,*)”,、“或,(or,+)”,、“非,(not,-)”,等将检索词连接的提问式。,注意:优先级为,not,and,or,,用括号保证优先权;运算符两侧必须各有一个空格(半角)。,18,精选ppt,逻辑提问式(布尔逻辑组配):18精选ppt,实例:,膜法提取甘露醇中的微生物污染控制,(膜法,+,膜集成)*甘露醇*(细菌污染,+,微生物污染),写出以下检索词,并用上述布尔逻辑符写出检索式:,固氮和固碳的生化机理或基因机制,19,精选ppt,实例:写出以下检索词,并用上述布尔逻辑符写出检索式:19精选,在检索词之间使用,规定算符两边的检索词出现在记录中的的位置,以提高检准率。比如:如果不用,with,位置算符,则词组可能被系统识别为逻辑运算,,protein disulfide isomerase,(蛋白质二硫键异构酶)可能被识别成“,protein AND disulfide AND isomerase”,。尤其是出现数字等符号时不易识别成词组。,(二)、位置算符,20,精选ppt,在检索词之间使用,规定算符两边的检索词出现在记录中的的位,常见的位置算符如下:,位置算符,表示方法,说明,with,(W),或,(),两个词在命中结果中相邻(可有空格、标点和连字符),词序不得颠倒。,(,nW,),两个词之间最多可夹入,n,个词,词序不得颠倒。,near,(,N,),两个词在命中结果中相邻,词序可颠倒。,(,nN,),两个词之间最多可夹入,n,个词,词序可颠倒。,field,(F),两个词在同一字段出现,位置不固定。,subfield,(S),两个词在同一子字段出现,位置不固定。,link,(L),两个词在同一规范词单元内出现,位置不固定。,21,精选ppt,常见的位置算符如下:位置算符表示方法说明(W)或()两个词在,(三)、通配符(截词检索),截词检索,就是将,截词符如,“,*,”,、,“,?,”,等等,放在检索词中检索者认为合适的地方截断,用截断的词的一个局部进行检索,并认为凡满足这个词局部中的所有字符,(,串,),的文献,都为命中文献。多用于外文检索,因为西文语言的特点是构词灵活,在词干上前缀或后缀就可以派生出许多新的词汇。,检索词的词干后(前)加一个,“,?,”,(有的系统为加*),表示词干后(前)可以有任意个字符。,如,“,apple?,”,可代替,(apple+apples+apple-pie+applesauce),;,22,精选ppt,(三)、通配符(截词检索)截词检索,就是将截词符如“*”,由于文字结构方面的原因,中文检索系统极少使用通配符进行截词。,椰壳制备高比表面积活性炭,,,椰壳可能表达为椰子壳,可以用“(椰子壳十椰壳)*,高比表面积活性炭,”,,或直接用“椰*,高比表面积活性炭,”,23,精选ppt,由于文字结构方面的原因,中文检索系统极少使用通配符进行截词。,(四)、禁用词,在绝大多数的检索系统中,介词、代词、等单独使用无实际意义的词以及使用频率很高的词不能作为检索词,被称为禁用词,如,an,,,and,,,by,,,for,,,from,,,of,,,the,,,to,,,with,等等。,24,精选ppt,(四)、禁用词在绝大多数的检索系统中,介词、代词、等单独使用,(五)、限制检索(检索途径),在命令式检索中,通常要用字段代码来限定检索的字段,不同的数据库使用的字段代码略有不同。,25,精选ppt,(五)、限制检索(检索途径)在命令式检索中,通常要用字段,六 加权检索,是一种定量检索技术:在每个提问词后面给定一个数值表示其重要程度,这个数值称为权,在检索时先查找这些词在记录中是否存在,然后计算存在的权值总和,权值之和达到或超过给定阈值,该记录即为命中记录。,26,精选ppt,六 加权检索是一种定量检索技术:在每个提问词后面给定一个数,七 聚类检索,把相似度较高的文献集中在一起形成一个个的文献类的检索技术。,27,精选ppt,七 聚类检索 把相似度较高的文献集中在一起形成一个个的文献类,八、匹配方式,P37-38,前方一致:检出文献的相关字段前方和检索词一致,如:检索词为“世界贸易组织”,可检出,世界贸易组织概论,,检不出,大学世界贸易组织教程,精确检索:,表示检索词和检出文献的相关字段完全一致,如检索词为“世界贸易组织”,可检出,世界贸易组织,,检不出,大学世界贸易组织教程,和,世界贸易组织概论,模糊检索:,包含关系,检索词可以在相关字段的任何位置。这是最常见的匹配方式。,28,精选ppt,八、匹配方式 P37-38前方一致:检出文献的相关字段前方,在许多检索系统中(,CNKI,、万方、搜索引擎),,精确检索,表示包含关系,即检索词不被切分,包含在相关字段的任何位置,与前述的模糊检索相同。,模糊检索,表示自动分词检索。,29,精选ppt,在许多检索系统中(CNKI、万方、搜索引擎),精确检索表示,分,析,检,索,课,题,选,择,工,具,确,定,检,索,词,编,制,检,索,式,显,示,及,判,断,检,索,结,果,获,取,原,始,文,献,文,献,阅,读,和,分,析,评,价,输,出,检,索,结,果,否,不满意,是,满意,第四节检索步骤,30,精选ppt,分选编显获文输否不满意是满意第四节检索步骤30精选ppt,普查型:,需要全面收集有关某一主题的文献资料,如以课题开题、教材编写等。具有普查、回溯的特点,要求尽可能高的查全率。,攻关型:,需要收集有关某一主题某一特定方面的文献,其目的在于解决科研、生产中的关键问题,这类需求不强调查询的文献数量,但需要查得的文献具有较强的专指性。,学习型,:,需要了解掌握某一领域的研究动向、研究成果或相关知识,要求查到的文献具有新颖及时的特点,而对查全率和查准率不一定有很高的要求。,1,、课题分析,31,精选ppt,1、课题分析31精选ppt,2,、选择检索工具,全面性:,即是否与课题相关的内容都要检索,包括的工具有,一次文献和