任务二 信息检索原理

广义的信息检索是指将信息进行概念分析,通过标引(分类、主题、提名、作者、代码、字段等),依据标引组织成信息系统;信息用户则依据标引在信息系统中检索有关部门信息。所以它通常被称为“信息存储与检索”。狭义的信息检索指广义的信息检索的后半个过程。

这里所说的“信息系统”指的是有组织的信息整体。就是将大量的信息,用具体的数据项标志、标引、排列和储存起来。它可以是图书馆、信息中心的全部馆藏,数据库的全部记录。

由此可知,信息检索的本质就是读者(用户)的信息需求与存储在信息集合体中的信息进行比较和选择,即匹配(match)的过程。也就是对一定的信息集合体(系统)采用一定的技术手段,根据一定的线索与准则找出(命中)相关的信息。存储是为了检索,没有存储就无所谓检索。信息的存储与检索存在着相辅相成的辩证关系。

信息检索是通过信息系统来实施的。信息系统包含信息集合的载体和技术设备。按信息的存储媒体和技术手段来分,信息系统有两种:手工检索信息系统和计算机检索信息系统。

1.手工检索(manual retrieval)

简称手检,使用的主要是书本型、卡片式的信息系统,即书目、索引、文摘和各类工具书。检索过程是由人脑和手工操作的配合来完成的,用户的需求概念和目录体系中概念的匹配是通过人脑的思考、比较和选择来实现的。

2.计算机检索(computer-based retrieval)

简称机检,使用的是计算机信息系统。系统包含计算机设备、终端、通信设施、数据库和检索应用软件等。信息检索的对象是数据库。信息检索过程是在人机的协同作用下完成的,从计算机存储的大量数据中自动分拣出读者所需要的,即与读者提问(query)相关的信息。匹配是由机器执行的,而人则是整个检索方案的设计者和操纵者。这里,检索的本质没有变,发生变化的只是信息的媒体形式、检索手段、存储方式和匹配方法。

信息检索流程如图1-1所示。

图1-1 信息检索流程图