进行档案信息检索的两个必要条件是_百度知道信息检索学习任务单
信息检索学习任务单
1、通过主题目录能找到需要的信息吗?
(1)目前我比较感兴趣的内容是
学习&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
(2)我准备使用的第一个网站提供的主题目录是:&周杰伦资料&&&&&&&&&&&&&&&
,该网站网址是:
&&&&&&&&&/profile/ZhouJieLun-15657/&&&&&&
(3)有没有找到你所需要的内容?&&&&有&&&&&&&&&&&&
。如果找到该内容,则该内容在主题目录中的层次为:首页----hao123&
----&&百度
----周杰伦资料----
(4)使用第二个网站重复查找该内容,该网站网址是:&/view/2632.htm&&&&&&&&&&&&&&&&&&&&&
。如果找到该内容,则该内容在主题目录中的层次为:首页----
hao123&----百度----周杰伦资料----&&
2、主题目录是如何管理因特网资源列表的?
请尝试在“雅虎中国”网的分类网站栏目中,进行网站登录。
(1)准备登陆的网站是:周杰伦资料&&&&&
,其网址是:&&./search?v=web&ei=gbk&searchFlag=&fr=fp-tab-web-ycn&pid=ysearch&source=yahoo_yhp_0706_search_button&p=�ܽ�������&&&&&
(2)能够在分类网站栏目的首页中直接进行网站的登陆吗?
能&&&&&&&&&&&
如果不能直接登陆,那是什么原因呢?&&&&但是直接登上拉&&&&&&&&
(3)你准备登陆的网站将存放的分类位置是:&&&&&hao123&&&
/&&雅虎中国&&&
/周杰伦资料
3、如何在因特网上找到更多的信息?
(1)通过主题目录你找到了自己感兴趣的内容吗?
&&&&找到了&&&&&&
数量多吗?&&&&多&&&&&&&&&&&&
(2)请尝试用新浪网或雅虎中国中的“搜索”功能,查找刚在在主题目录中查找过的相同内容,可以找到多少信息?&很多&&&&&&&&&&&&&&&&&&&&&
(3)什么是搜索引擎?搜索引擎指自动从英特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。英特网上的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为你绘制一幅一目了然的信息地图,供你随时查阅。
搜索引擎的工作原理
搜索引擎的工作原理大致可以分为:
1、搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超连结,机器人便可以遍历绝大部分网页。
2、整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。
3、接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这些通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
4、那个搜索引擎是比较优秀的网络信息搜索工具?
分小组学习,试比较几个常用的中文搜索引擎的性能,完成下表:
你所使用的搜索关键词是:
搜索引擎名称
通过比较,较好的搜索引擎是:baidu&&&
,理由是:googlegoogle&&&&&&&&&&&&&&&&
5、全文检索技术有什么重要作用?
(1)全文检索技术是指:&&
&随着计算机产业的发展,以计算机存储设备为载体的电子信息愈来愈多,这些信息大致可分为两类:结构化数据和非结构化数据,结构化数据指的是诸如企业财务帐目和生产数据、学生的分数数据等等,非结构化数据的则是一些文本数据、图象声音等多媒体数据等等。据统计,非结构化数据占有整个信息量的80%以上。
对于结构化数据,用RDBMS(关系数据库管理系统)技术来管理是目前最好的一种方式。但是由于RDBMS自身底层结构的缘故使得它管理大量非结构化数据显得有些先天不足,特别是查询这些海量非结构化数据的速度较慢。而通过全文检索技术就能高效地管理这些非结构化数据。
经过几年的发展,全文检索从最初的字符串匹配程序已经演进到能对超大文本、语音、图像、活动影像等非结构化数据进行综合管理的大型软件。由于内涵和外延的深刻变化,全文检索系统已成为新一代管理信息系统的代名词,衡量全文检索系统的基本指标也逐渐形成规范。
首先,我们关注的是查全率,即系统在进行某一检索时,检索出的相关资料量与系统资料库中相关资料总量的比率。查准率则是保证我们找到最有用资料的一个关键,是系统在进行某一检索时,检索出的有用资料数量与检索出资料总量的比率。检索速度或者说响应时间是提高工作效率的保障,指的是从提交检索课题到查出资料结果所需的时间。最基本的检索速度是应该达“千万汉字,秒级响应"。还有诸如收录范围(所查找的范围)、用户负担(用户在检索过程中付出精力的总和)、输出形式(输出信息表现形式)等指标也是衡量全文检索系统优劣的要素。
搜索引擎应该是全文检索技术最主要的一个应用。目前,搜索引擎的使用已成为排在收发电子邮件之后的第二大互联网应用技术。搜索引擎起源于传统的信息全文检索理论,即计算机程序通过扫描每一篇文章中的每一个词,建立以词为单位的到排文件,检索程序根据检索词在每一篇文章中出现的频率和每一个检索词在一篇文章中出现的概率,对包含这些检索词的文章进行排序,最后输出排序的结果。全文检索技术是搜索引擎的核心支撑技术。
一个好的检索引擎是一个理想站点的关键。很多人在访问一个站点时喜欢使用站点检索,站点检索应是分类目录导航和全文检索的完美结合,具体包括以下几个方面:
分类目录导航的关键是检索范围,检索范围的限制能使得检索结果不会太多、太滥;
全文检索对于站点检索是必不可少的,在通常情况下能够帮助人们很快地找到所要的网页;
有时利用分类目录导航和全文检索还很难定位到所要的信息,这时就要组合检索辅助;
必须有相关排序功能,因为当检索结果太多时,用户不可能一一浏览,大多数用户只浏览前面几条,没有相关排序,可能准确的检索结果排在后面,用户不能浏览到,而排在前面的检索结果却相关性很少,造成用户的错觉。
此外,我们还要考虑HTML/XML的特殊性、支持大量并发用户突发访问、Web站点的动态特性、要求索引维护效率很高等方面。&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
(2)尝试在关键词外加双引号的区别,如“奥林匹克运动会”与奥林匹克运动会分别作为关键词时,经过搜索后所得到的不同结果。
(3)你所使用的关键词是:&&奥林匹克运动会&&&&&&&&&&&&&&&&&&&&&&&&&&&&
信息准确性
不加双引号
6、搜索引擎与主题目录的网络资源列表管理方式有何不同?
阅读有关资料,列表说明搜索引擎和主题目录的异同:
信息收集方法
信息管理技术
主要优缺点
7、如何利用搜索引擎更有效的检索信息?(表格中填写检索到的网页数,注意有些搜索引擎中减号后面不能有空格)。
关键词示例
奥运会 雅典
奥运会-雅典
自己使用的关键词
奥运会 雅典&
&奥运会-雅典
使用GOOGLE
空格运算符的作用是:&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
减号运算符的作用是:&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。信息检索学习任务单
1、通过主题目录能找到需要的信息吗?
(1)目前我比较感兴趣的内容是&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
(2)我准备使用的第一个网站提供的主题目录是:&&&&&&&&&&&&&&&&&&&&&
,该网站网址是:&&&&&&&&&&&&&&&
(3)有没有找到你所需要的内容?&&&&&&&&&&&&&&&&
。如果找到该内容,则该内容在主题目录中的层次为:首页----&&&&&&&
----&&&&&&&&&&
(4)使用第二个网站重复查找该内容,该网站网址是:&&&&&&&&&&&&&&&&&&&&&&
。如果找到该内容,则该内容在主题目录中的层次为:首页----
&&&&&&&----&&&&&&&&
2、主题目录是如何管理因特网资源列表的?
请尝试在“雅虎中国”网的分类网站栏目中,进行网站登录。
(1)准备登陆的网站是:&&&&&&&&&&
,其网址是:&&&&&&&
(2)能够在分类网站栏目的首页中直接进行网站的登陆吗?
&&&&&&&&&&&&
如果不能直接登陆,那是什么原因呢?&&&&&&&&&&&&&&&&&&&
(3)你准备登陆的网站将存放的分类位置是:&&&&&&
3、如何在因特网上找到更多的信息?
(1)通过主题目录你找到了自己感兴趣的内容吗?
&&&&&&&&&&&&&&&&
数量多吗?&&&&&&&&&&&&&&&&&
(2)请尝试用新浪网或雅虎中国中的“搜索”功能,查找刚在在主题目录中查找过的相同内容,可以找到多少信息?&&&&&&&&&&&&&&&&&&&&&&&&
(3)什么是搜索引擎?&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
4、那个搜索引擎是比较优秀的网络信息搜索工具?
& 分小组学习,试比较几个常用的中文搜索引擎的性能,完成下表:
你所使用的搜索关键词是:
搜索引擎名称
通过比较,较好的搜索引擎是:&&&
,理由是:&&&&&&&&&&&&&&&&
5、全文检索技术有什么重要作用?
(1)全文检索技术是指:&&
&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
(2)尝试在关键词外加双引号的区别,如“奥林匹克运动会”与奥林匹克运动会分别作为关键词时,经过搜索后所得到的不同结果。
(3)你所使用的关键词是:&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
信息准确性
不加双引号
6、搜索引擎与主题目录的网络资源列表管理方式有何不同?
阅读有关资料,列表说明搜索引擎和主题目录的异同:
信息收集方法
信息管理技术
主要优缺点
7、如何利用搜索引擎更有效的检索信息?(表格中填写检索到的网页数,注意有些搜索引擎中减号后面不能有空格)。
关键词示例
奥运会 雅典
奥运会-雅典
自己使用的关键词
使用GOOGLE
空格运算符的作用是:&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
减号运算符的作用是:&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。信息检索复习提纲及***_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
信息检索复习提纲及***
上传于||文档简介
&&工程硕士的信息检索课程
阅读已结束,如果下载本文需要使用1下载券
想免费下载本文?
定制HR最喜欢的简历
你可能喜欢文献检索与资料收集_图文_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
文献检索与资料收集
上传于||暂无简介
大小:54.50KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢