模块一 实用信息检索基础

学习目标

能力目标

1.掌握信息检索基本原理;

2.掌握信息检索类型;

3.熟悉信息检索相关性问题。

知识目标

1.掌握信息检索方法;

2.了解评估检索效果主要指标;

3.掌握信息检索具体步骤。

知识框架

重点难点

1.信息检索的类型;

2.信息检索方法;

3.检索系统的评价。

导入案例

“人肉搜索”的法律性质——“人肉搜索”是双刃剑

就“人肉搜索”的本质来说,它是搜索信息的一种方式,能够弥补传统搜索引擎的不足。一方面,从技术角度来说,它是有优越性的,其本身并不是邪恶之源,合理的使用是信息检索技术革新的表现。“5·12”汶川大地震发生后,由于通信、交通的大面积中断,失散的人们难以知道自己亲人的生死及下落,灾区犹如一座信息“孤岛”。尽管有关政府部门、医院、报纸、网站都在以不同的形式,发布着遇难者或幸存者的信息,但这些杂乱的信息即使用常规的搜索引擎也难以有效查询。此时,谷歌的技术人员率先制作出了专门用于寻找亲人的“人肉搜索”引擎。该寻亲搜索平台在短期内收集了大量的急救医院和震区安置点的消息,让急切寻找亲人的网友搜索。因为大部分消息都是以纸质形式发布的,都是靠热心网友通过手机、相机等工具拍下图片传到网站,再由网站技术人员手工录入的,所以这也凸显了该引擎的“人肉搜索”的正义性。再如,持续数月的华南虎事件能够水落石出,“人肉搜索”的力量显而易见。

但另一方面,如果“人肉搜索”被不当利用的话,对于人们来说就是一种灾难。2007年12月27日晚间,在一则中央电视台关于网络视听的新闻里,出现了一名北京某初中在校女生张某接受采访的镜头。该女生在接受采访时说:“上次我上网查资料,突然弹出来一个网页,很黄很暴力,我赶紧把它给关了。”张某的外貌和真实姓名均在新闻中公开。随后,关于张某的视频、图片、恶搞漫画、帖子开始在互联网上泛滥。尤其是有人根据央视的本期报道也作了一篇名为《很黄很暴力》的帖子,自2008年1月1日发出后,截至1月5日凌晨,跟帖达1200条。在其中一个回帖中,有匿名人士把张某的出生年月、所在学校、平时成绩及所获奖励等详细信息进行了公开,内容精确到张某的出生医院名字。还有好事者,公布了一份某年的中小学生书法比赛名单,其中就有张某的名字。此次事件给张某造成了很大的影响,由于受害者是未成年人,因而这一案例更加引起人们对于人肉搜索侵犯个人隐私问题的思考。