,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,例,1,:班上新来了一位外省的同学,我们决定向他介绍一下我们美丽的海南,并收集一些与海南相关的文字、图片等有关的材料。我们怎样才能快速而全面的收集所需要的材料呢?,上网搜索,用百度搜索,1.3.1,因特网中的信息检索,因特网信息资源广泛分布在整个网络之中,没有统一的管理机构,也没有统一的目录,这给使用和查找因特网信息资源带来了一定的难度,由此,搜索引擎(,Sesrch Engine,)应运而生。,搜索引擎是一种用于帮助因特网用户查询信息的搜索工具,它以一定的策略在因特网中搜集、发现信息,对信息进行理解、提取、组织的处理,并为用户提供检索服务,从而起到信息导航的目的。,1.,目录索引类与全文搜索引擎,在检索中文文本资料时,经常使用的是目录索引类搜索引擎、全文搜索引擎两类信息检索方式,这也是因特网上常用的两类信息检索方式,具体事例如下:,类型,举例,目录索引类搜索引擎,全文搜索引擎,2.,元搜索引擎,目录索引类搜索引擎和全文搜索引擎的检索范围一般在本引擎的数据库内,由于不同的搜索引擎各自的信息收集方式和范围、检索算法和结果排序方法都,各不相同,因此检索结果也不尽相同。为了能够收集到更完善的信息,则需要选择恰当的搜索引擎或者把多个搜索引擎结合起来,正是为了利用多种多样的搜索引擎并节省时间,,1995,年元搜索,引擎(,MetaSearch Enginc),出现了。,2.,元搜索引擎,使用元搜索引擎,用户只需提交一次搜索请求,由元搜索引擎负责转换处理后,提交给预先选定的其他多个搜索引擎,同时检索多个数据库,并根据多个搜索引擎的检索结果进行二次加工,然后将结果输出给用户。,3.,特色信息检索工具,当我们查找图片、音频等信息时,使用综合信息检索引擎通常会找到很多无用的信息,所以搜索效率和有效性都不高。这时,就可以使用特色搜索引擎(,有时是综合信息检索工具中的一个功能,),特色检索工具专门搜集某一类的信息资源,内容丰富,数据量大,能帮助我们迅速找到一些有用的信息。,3.,特色信息检索工具,此外还有一些专业性质的搜索引擎,如,SOSIG,是专门搜集社会科学信息的信息检索工具(,http:/www.sosig.ac.uk,),涉及经济学、哲学、教育、政治、环境科学、心里学、人类学、社会福利、政府管理和妇女研究等信息资源。,4.,其他信息检索工具,以,FTP,、,Telnet,、,Usenet,等资源为检索,对象的检索工具。,如北大天网、,Archic,等。,5.,因特网信息检索的发展趋势,经过多年的发展之后,目前搜索引擎的功能越来越强大提供的服务也越来越全面,并呈现出如下一些发展趋势:,(,1,),.,多媒体信息检索,(,2,),.,专业 垂直搜索引擎,1.3.2,信息检索工具的工作原理,1.,全文搜索引擎的工作原理,2.,目录索引雷搜索引擎的工作原来,1.,全文搜索引擎的工作原理,先看个例子:,假设你去买笔。对老板说:“我要买支笔”老板问:“什么笔?”“圆珠笔”“什么颜色”“蓝色”老板便会从柜台中拿出一支蓝色的圆珠笔。,查找信息,输入描述信息的关键词,在数据库中检索,结果显现,购物,描述商品特征,取货,交给顾客,买笔,圆珠笔 蓝色,柜台取货,1.,全文搜索引擎的工作原理,组成部分,负责工作,搜索器,定期自动到各网站上抓取网页,索引器,分析抓取的网页,索引,存入服务器的数据库中,检索器,接收用户提交的关键词,从索引数据库中提取相关资源,向用户显现结果,搜索引擎的组成,全文搜索引擎的工作原理:,搜索器,索引器,输入查询表达式,查询结果显示,查询信息排序,采集结果,索引,数据库,检索器,索引,排序,用户查询,查询结果,信息采集,筛选,百度搜索“海南概括”:,百度蜘蛛,输入“海南概括”,查询结果显示,查询信息排序,检索器,索引器,索引,数据库,索引,排序,用户查询,查询结果,检索,中国日报网,爬,中国在线海南概括页面,网址,抓,抽取“海南,、概括”等,关键字,抽取,关联,2.,目录索引类搜索引擎的基本工作原理,(,1,),.,人工采集和存储网络信息,手工为每个网站确定一个标题,给出大概的描述,建立关键字索引,将其放入相应的类目体系中。,(,2,),.,网络目录:,按主题性质分类,以某种分类体系为依据,形成由信息链组成的树状结构,即总目录,专题目录,链接,网站,先分领域,后分各科专,题,最后列出网站,2.,目录索引类搜索引擎的基本工作原理,目录索引,全文索引,无需输入关键字,可通过浏览主题了解某一主题的相关资源,需要关键字查询,人工采集并存储网络信息,搜索器在因特网中抓取网页,索引器提取、组织并建立数据库,网页内容丰富、学术性较强,信息资源多、复杂,不易了解主题内容,维护费用大、更新速度慢,搜索器定期自动“抓”网页,(,3,),.,特点和区别,2.,因特网资源检索策略,搜索内容,引擎选择,一般信息资源,综合性的(百度、,google,),图片、视频,特色的,也可以用综合搜索引擎的某个功能,专业性较强,专业搜索引擎,全面了解网上信息资源,元搜索引擎,