你乐谷
首页 > 图文

搜索引擎的分类

2023-03-16 来源:你乐谷

搜索引擎的分类

本文核心词:

搜索引擎的分类


攻击者经常会利用各大搜索引擎来搜集用户的信息,这些搜索引擎主要分为几种类型,攻击者一般都比较熟悉各类搜索引擎,这可以使他们更加方便地利用各类搜索引擎来搜集用户信息。下面就给大家简单介绍三类搜索引擎。
2.2.1全文搜索引擎
全文搜索引擎是名副其实的搜索引擎,国外代表有Google,国内则有著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果。从搜索结果来源的角度看,全文搜索引擎又可以细分为两种: 一种是拥有自己的检索程序,俗称机器人程序或蜘蛛程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的搜索引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。
全文搜索引擎有全文搜索、检索功能强、信息更新速度快等优点。但也有其不足之处,提供的信息虽然多而全,但可供选择的信息太多反而降低了相应的命中率,并且提供的查询结果重复链接较多,层次结构不清晰,给人一种繁多杂乱的感觉。
2.2.2目录索引
目录索引虽然具有搜索功能,但严格意义上不能称其为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以按照分类目录找到所需要的信息,不依靠关键词进行查询。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo, 以及国内的搜狐、新浪、网易等。另外,在网上的一些导航站点,也可以归属为原始的分类目录。
目录索引与全文搜索引擎的区别在于它是由人工建立的,通过“人工方式”将站点进行了分类,不像全文搜索引擎那样,将网站上的所有文种和信息都收录进去。目录索引首先将某网站划分到某个分类下,再记录一些摘要信息,对该网站进行概述性的简要介绍,用户提出搜索要求时,搜索引擎只在网站的简介中搜索,它的主要优点有:层次结构清晰,易于查找;多级类目,便于查询到具体明确的主题;在内容提要、分类目录下有简明扼要的内容,使用户一目了然。其缺点是搜索范围较小、更新速度慢、查询交叉类目时容易遗漏。
2.2.3元搜索引擎
元搜索引擎一般没有自己的网络机器人及数据库,它们的搜索结果是通过调用、控制和优化其他多个独立搜索引擎的搜索结果,并以统一的格式在同一界面集中显示。
著名的元搜索引擎有InfoSpace、Dogpile、 Vivisimo 等,中文元搜索引擎中最具代表性的是搜星搜索引擎。在搜索结果排列方面,有的直接按来源排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
2.3搜索引擎的关键技术
现在网上搜索引擎很常见,很多网站建立了搜索引擎。一些经常用到、比较大的网络搜索引擎有前面提到的百度、谷歌等,在这些搜索引擎网站上直接输入想查找内容的关键字,可以很快地在网络上查到需要的信息,攻击者也青睐于这些搜索引擎技术来帮助他们搜索需要的各种信息。下面就带领大家来学习搜索引擎的一些关键技术。
2.3.1信息收集和存储技术
信息收集和存储技术主要包括两种方式,即人工方式和自动方式。
人工方式采用传统信息收集、分类、存储、组织和检索的方法。研究人员对网站进行调查、筛选分类存储。由专业人员手工建立关键字索引,再将索引信息存入计算机相应的数据库中。
猜你喜欢