文献检索

文献检索

文献检索(Information Retrieval)是指根据学习和工作的需要获取文献的过程。宋代朱熹认为"文指典籍,献指熟知史实的贤人",近代认为文献是指具有历史价值的文章和图书或与某一学科有关的重要图书资料,随着现代网路技术的发展,文献检索更多是通过电脑技术来完成。

  • 中文名称
    文献检索
  • 外文名称
    Information Retrieval
  • 装 订
    平装
  • 属 于
    书籍

​词条名片

文献检索(Information Retrieval),是指将信息按一定的方式组织和存储起来,并根据信息使用者的需要找出有关的信息过程,所以它的全称又叫“信息的存储与检索(Information Storage and Retrieval),这是广义的信息检索。狭义的信息检索则仅指该过程的后半部分,即从信息集合中找出所需要的信息的过程,相当于人们通常所说的信息查寻(Information Search)。

文献检索

文献等级分类

电脑信息检索

是指以电脑技术为手段,通过光碟和在线上等现代检索方式进行信息检索的方法。与手工检索一样,电脑信息检索应作为未来科技人员的一项基本功,这一能力的训练和培养对科技人员适应未来社会和跨世纪科研都极其重要,一个善于从电子信息系统中获取信息的科研人员,必定比不具备这一能力的人有更多的成功机会,美国报道生活新方式的期刊POV 也将互动网路检索专家作为未来十大热门职业之一,这些情况都说明了电脑信息检索越来越重要,故值得大家对这一技术予以重视。

零次文献

指未经正式发表或未形成正规载体的一种文献形式。如:书信,手稿,会议记录,笔记等。

特点:客观性,零散性,不成熟性。一般是通过口头交谈、参观展览、参加报告会等途径获取,不仅在内容上有一定的价值,而且能弥补一般公开文献从信息的客观形成到公开传播之间费时甚多的弊病。

也有研究者在以上分类基础上再加上零次文献,它是指未经过任何加工的原始文献,如实验记录、手稿、原始录音、原始录像、谈话记录等。零次文献在原始文献的储存、原始资料的核对、原始构思的核定(权利人)等方面有着重要的作用。

一次文献

(primary document):是指作者以本人的研究成果为基本素材而创作或撰写的文献,不管创作时是否参考或引用了他人的着作,也不管该文献以何种物质形式出现,均属一次文献。大部分期刊上发表的文章和在科技会议上发表的论文均属一次文献。

二次文献

(secondary document):是指文献工作者对一次文献进行加工、提炼和压缩之后所得到的产物,是为了便于管理和利用一次文献而编辑、出版和累积起来的工具性文献。检索工具书和网上检索引擎是典型的二次文献。

三次文献

(tertiary document):是指对有关的一次文献和二次文献进行广泛深入的分析研究综合概括而成的产物。如大百科全书、辞典、电子百科等。

检索语言

简介

文献检索语言是一种人工语言,用于各种检索工具的编製和使用、并为检索系统提供一种统一的、作为基準的、用于信息交流的一种符号化或语词化的专用语言。因其使用的场合不同,检索语言也有不同的叫法。例如在存储文献的过程中用来标引文献,叫标引语言;用来索引文献则叫索引语言;在检索文献过程中则为检索语言。检索语言按原理可分为3大类:

分类语言

它是将表达文献信息内容和检索课题的大量概念,按其所属的学科性质进行分类和排列,成为基本反映通常科学知识分类体系的逻辑系统,并用号码(分类号)来表示概念及其在系统中的位置,甚至还表示概念与概念之间关系的检索语言。 《中国图书馆图书分类法》是我国图书分类法的基础,中图法把一切知识门类按"五分法"分为马列、毛泽东思想;哲学;社会科学;自然科学;综合性图书这五大部类。在此基础上建成由22个大类组成的体系系列。

主题语言

是指经过控製的,表达文献信息内容的语词。主题词需规範,主题词表是主题词语言的体现,词表中的词作为文献内容的标识和查找文献的依据

关键字语言

指从文献内容中抽出来的关键的词,这些词作为文献内容的标识和查找目录索引的依据关键字不需要规範化,也不需要关键字表作为标引和查找图书资料的工具。

自然语言

指文献中出现的任意词。

检索途径

着者途径

许多检索系统备有着者索引、机构(机构着者或着者所在机构)索引,专利文献检索系统有专利权人索引,利用这些索引从着者、编者、译者、专利权人的姓名或机关团体名称字顺进行检索的途径统称为着者途径。

题名包括书名刊名等途径

一些检索系统中提供按题名字顺检索的途径,如书名目录和刊名目录。

分类途径

按学科分类体系来检索文献。这一途径是以知识体系为中心分类排检的,因此,比较能体现学科系统性,反映学科与事物的隶属、派生与平行的关系,便于我们从学科所属範围来查找文献资料,并且可以起到"触类旁通"的作用。从分类途经检索文献资料,主要是利用分类目录和分类索引。

主题途径

通过反映文献资料内容的主题词来检索文献。由于主题法能集中反映一个主题的各方面文献资料,因而便于读者对某一问题、某一事物和对象作全面系统的专题性研究。我们通过主题目录或索引,即可查到同一主题的各方面文献资料。

引文途径

文献所附参考文献或引用文献,是文献的外表特征之一。利用这种引文而编製的索引系统,称为引文索引系统,它提供从被引论文去检索引用论文的一种途径,称为引文途径。

序号途径

有些文献有特定的序号,如专利号、报告号、契约号、标準号、国际标準书号和刊号等。文献序号对于识别一定的文献,具有明确、简短、唯一性特点。依此编成的各种序号索引可以提供按序号自身顺序检索文献信息的途径。

代码途径

利用事物的某种代码编成的索引,如分子式索引、环系索引等,可以从特定代码顺序进行检索。

专门项目途径

从文献信息所包含的或有关的名词术语、地名、人名、机构名、商品名、生物属名、年代等的特定顺序进行检索,可以解决某些特别的问题。

检索方法

直接法

又称常用法,是指直接利用检索系统(工具)检索文献信息的方法。它又分为顺查法、倒查法和抽查法。

顺查法

顺查法是指按照时间的顺序,由远及近地利用检索系统进行文献信息检索的方法。这种方法能收集到某一课题的系统文献,它适用于较大课题的文献检索。例如,已知某课题的起始年代,现在需要了解其发展的全过程,就可以用顺查法从最初的年代开始,逐渐向近期查找。

倒查法

倒查法是由近及远,从新到旧,逆着时间的顺序利用检索工具进行文献检索的方法。此法的重点是放在近期文献上。使用这种方法可以最快地获得最新资料。

抽查法

抽查法是指针对项目的特点,选择有关该项目的文献信息最可能出现或最多出现的时间段,利用检索工具进行重点检索的方法。

追溯法

是指不利用一般的检索系统,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献信息範围,一环扣一环地追查下去的方法。它可以像滚雪球一样,依据文献间的引用关系,获得更好的检索结果。

迴圈法

又称分段法或综合法。它是分期分交替使用直接法和追溯法,以期取长补短,相互配合,获得更好的检索结果。

检索步骤

文献检索是一项实践性很强的活动,它要求我们善于思考,并通过经常性的实践,逐步掌握文献检索的规律,从而迅速、準确地获得所需文献。一般来说,文献检索可分为以下步骤:

(1)明确查找目的与要求;

(2)选择检索工具;

(3)确定检索途径和方法;

(4)根据文献线索,查阅原始文献。

检索工具

指印刷型检索工具,主要有以下类型:

(1)、目录、索引、文摘 目录,也称书目。它是着录一批相关图书或其它类型的出版物,并按一定次序编排而成的一种检索工具。 索引,是记录一批或一种图书、报刊等所载的文章篇名、着者、主题、人名、地名、名词术语等,并标明出处,按一定排检方法组织起来的一种检索工具。索引不同于目录,它是对出版物(书、报、刊等)内的文献单元、知识单元、内容事项等的揭示,并注明出处,方便进行细致深入的检索。 文摘,是以提供文献内容梗概为目的,不加评论和补充解释,简明、确切在记述文献重要内容的短文。汇集大量文献的文摘,并配上相应的文献题录,按一定的方法编排而成的检索工具,称为文摘型检索工具,简称为文摘。

(2)、百科全书 参考工具书之王。它是概述人类一切门类或某一门类知识的完备工具书,是知识的总汇。它是对人类已有知识进行汇集、浓缩并使其条理化的产物。百科全书一般按条目(词条)字顺编排,另附有相应的索引,可供迅速查检。

(3)、年鑒 按年度系统汇集一定範围内的重大事件、新进展、新知识和新资料,供读者查阅的工具书。它按年度连续出版,所收内容一般以当年为限。它可用来查阅特定领域在当年发生的事件、进展、成果、活动、会议、人物、机构、统计资料、重要档案或文献等方面的信息。

(4)、手册名录 手册,是汇集经常需要查考的文献、资料、信息及有关专业知识的工具书。 名录,是提供有关专名(人名、地名、机构名等)的简明信息的工具书。

(5)、词典(字典) 词典是最常用的一类工具书。分为语言性词典(字典)和知识性词典。

(6)、表谱、图录 表谱,採用图表、谱系形式编写的工具书,大多按时间顺序编排。主要用于查检时间、历史事件、人物信息等。图录,包括地图和图录两类。

(7)、类书、政书。

电脑检索工具

(1)SCI是美国《科学引文索引》的英文简称,其全称为:Science Citation Index,,创刊于1961年,它是根据现代情报学家尤金·加菲尔德(Eugene Garfield) 1953年提出的引文思想而创立的。时至今日加菲尔德仍是SCI主编之一。SCI是由ISI( Institute for Scientific Information Inc.)美国科学情报所出版。现为双月刊。ISI除了出版SCI外,还有在线上型据SCISEARCH。ISTP(Index to Scientific &Technical Proceeding)也由其出版。 SCI是一部国际性索引,包括有:自然科学、生物、医学、农业、技术和行为科学等,主要侧重基础科学。所选用的刊物来源于94个类、40多个国家、50多种文字,这些国家主要有美国、英国、荷兰、德国、俄罗斯、法国、日本、加拿大等,也收录一定数量的中国刊物。

(2)EI创刊于1884年,是美国工程信息公司(Engineering information Inc.)出版的着名工程技术类综合性检索工具。收录文献几乎涉及工程技术各个领域。例如:动力、电工、电子、自动控製、矿冶、金属工艺、机械製造、土建、水利等。

(3)ISTP创刊于1978年,由美国科学情报研究所编辑出版。该索引收录生命科学、物理与化学科学、农业、生物和环境科学、工程技术和套用科学等学科的会议文献,包括一般性会议、座谈会、研究会、讨论会、发表会等。其中工程技术与套用科学类文献约佔35%,其他涉及学科基本与SCI相同。

(4)中国知网,是国家知识基础设施(National Knowledge Infrastructure,NKI)的概念,由世界银行于1998年提出。CNKI工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于1999年6月。

(5)维普网建立于2000年,其所依赖的《中文科技期刊资料库》,是中国最大的数位期刊资料库。

其它不一一列举。

软体检索工具

在资源电子化的时代,人们已经能很方便的从各个资料库中检索到文献,科研人员为了检索所需要的文献,要登入不同的资料库进行检索,操作比较繁琐,于是,文献检索的软体应运而生,目前国内外有很多的文献管理软体都提供检索功能,集成的资料库越多,越方便使用,NoteExpress参考文献管理软体支持数以百计的全球图书馆书库和电子资料库,如万方、维普、期刊网、Elsevier ScienceDirect、ACS、OCLC、美国国会图书馆等。一次检索,永久储存。

分类

1.按照检索结果内容划分为以下三种:

(1)资料检索:以文献中的资料为对象的一种检索。如查找某种材料的电阻,某种金属的熔点;

(2)事实检索:以文献中的事实为对象,检索某一事件发生的时间,地点,或过程;如查找鲁迅生于某年;

(3)文献检索:以文献原文为检索对象的一种检索。

2.按照文献检索的手段划分为以下两种:

(1)手工检索;

(2)电脑检索。

我国文献检索教育的发展

第一阶段 1949年以前的目录学教育阶段

我国自古代起就比较重视目录学教育,到清朝乾嘉时期,目录学一度成为“显学”(着名的学说、学派),成为学人必读的一门学问。到了近代,在教育界人士和文化学者的热心倡导下,使用者教育以目录学、参考工具书使用法为主要内容在大学讲坛上得到了传播。这段时期,图书馆学情报学使用者教育处于萌芽时期,图书馆利用的教育刚出现,但因体製等原因没有坚持下去。如东南大学1920曾办过几次图书馆暑期学校,也搞过读者培训,但到1930年以后,由于学校内外条件的变迁、人事变动而未能继续下去。

第二阶段 1949-1966年的起步阶段

1949年以后,我国的高等教育进入了一个新的历史时期,大学图书馆也走上了新的发展阶段,图书馆的使用者教育走上起步阶段。无论在教育思想、目标、方法还是在观念形态、内容方面,大学图书馆使用者教育都发生了重大的变化。召开读书座谈会、组织阅读交流活动等,南京师範学院等为学生开设了“目录学”、“语文工具书使用方法”、“中文工具书使用方法”等课程;南京工学院等从20世纪50年代中期到1965年,曾为在校大学生讲过“怎样查找科技文献”、“美国四大报告文献检索”等课程。还有一些学校为学生开讲了专业文献利用课。

第三阶段 1976-1983年的生长时期

1966-1976年使用者教育陷入停顿或瘫痪。

1981年7月和8月,《人民日报》先后刊载刘毅夫、潘树广的建议在高校开设文献检索课的文章,1983年全国高校图书馆工作委员会秘书处筹办了理工、医葯、农业3个文献检索课师资培训班,10月召开了“全国高校《文献检索与利用》课专题讨论会”。

国内已有一定数量的学校开设了文献检索课。

第四阶段 1984年以后进入新的发展时期

①国家重视 1984年教育部下达的高教字004号档案《关于在高等学校开设文献检索与利用课的意见》。1985年9月又颁发了《关于改进和发展文献课教学的几点意见》提出了文献检索课“要逐步实现分层次连续教育”的教学指导思想,两个档案的颁发,成为使用者教育兴旺发达的重要保障,也为文献检索课的教学奠定了基础。1992年5月原国家教委再次印发了《文献检索课教学基本要求》,对文献检索课的课程性质、教学目的要求等作了细致而全面的规定,从而使文献检索课从形式到内容更加规範化、系统化。1996年成立了全国文献检索课教学指导小组。

②教学手段丰富 检索课程教育中开始套用多媒体技术编製电脑辅助教学课件,或在电子阅览室或多媒体教室进行演示性教学,或将教学内容做成互动式学习课程发布到网上供使用者自学。

③教学面扩大,教学队伍壮大 到1990年代中期已有700多所高校开设了“文献检索”课。形成了2000千多人的师资队伍,出版了600多种教材。经过近20余年的实践和探索,正在逐步发展成为一门具有一定理论深度和知识广度的课程。

④国家技术监督局在1992年11月颁布了《国家标準学科分类代码》,将文献检索学列为类目,成为一个独立的三级学科。国家教育部1988年颁布的《普通高等学校大学部专业目录和专业介绍》,其培养要求明确规定目录中的218种专业须“掌握文献检索、资料查询的基本方法”或“掌握资料查询、文献检索及运用现代信息技术获取相关信息的基本方法。”

原理一

1.从信息利用的角度考察,网际网路信息资源由哪三方面构成?答:从信息利用的角度考察,网际网路信息资源由连线在网上的电脑中的无数信息、网上的各种信息工具以及网路通信渠道三方面构成。

2.简述网路信息资源的特点。答:网路信息资源的特点是数量庞大、成长迅速;更新频繁、变化无常、分布散乱;良莠混杂。

3.如何正确认识网路信息与印刷性出版物在出版类型上的对应关系?按照出版类型区分,网路信息资源有着和印刷型出版物类似的对应关系。例如,印刷型的期刊有网路期刊与其相对应,印刷型的图书有网路图书与其相对应,印刷型的报告有网路报告与其相对应,如此等等。这种对应关系,仅限于我们对网路文献信息类型的认识,不能套用于具体的文献。例如,早期的印刷型文献一般不会有网路形式,多数的当前印刷型学术文献也不太可能找到对应的网上电子版本。

4.何谓原创性网路信息和二次网路信息?按照内容是否具有原创性,网路信息资源有一次资源和二次资源的区分。一次资源是指首次发表的原创性信息,二次资源是转载已有的信息。

5.何谓可见网路信息和不可见网路信息?按照是否属于搜寻引擎检索範围,网路信息资源可分为可见资源和不可见资源两类。

6.简述网路可见信息的两个条件。可见资源是搜寻引擎可搜寻到的资源。这种资源要满足两个条件:一是必须含有HTML超连结,二是没有设定口令,

7.简述网站和网页的关系。网页是用HTML或DHTML、XML等语言写成的文本档案。而网站则是有独立的域名,由若干相关网页组成的一个站点。按照微软公司的比喻,如果把WWW当作是Internet上的大型图书馆,则每个Web站点就是一本书,每个Web页面就是书的一页。

8.为什麽说网路学术信息不能唾手可得?原因主要有三:一是查找主页信息通常要通过查找搜寻引擎之类的中介资料库才能进行。而使用这些工具需要一些专门的技术,希望高效率地查找网路信息时尤其如此。二是一般情况下只使用一两种搜寻引擎所得的结果往往是沧海一粟。三是网际网路上学术类与非学术类信息的比例是1﹕10。再则,网上学术信息很多是以不可见资源形式存在着。因此查找网上信息的难度更大一些。9.按工作方式区分的搜寻引擎有哪三类搜寻引擎?按照工作方式的不同,搜寻引擎可以分为主题引擎、目录引擎和多元引擎。

10.简述主题引擎的三个组成部分。主题引擎由三个主要部分构成:Robot、Index和搜寻软体。

11.请举出典型的国外和国内主题引擎各一个。国外主题引擎的代表是Google,国内代表为百度。

12.为什麽主题引擎的分类途径不如目录指南型引擎?主题搜寻引擎提供的分类途径或者为自动分类的结果,或是借用其他目录引擎的分类资料(例如Google利用网景公司的Open Directory分类),因而分类检索效果不如由人工仔细分类的目录指南型搜寻引擎。

13.简述主题引擎与目录指南型引擎的主要区别。(1)信息处理深度,目录指南型引擎为网站,主题型引擎为网页;(2)信息处理方式,目录指南型引擎为有人工参与,主题型引擎为全自动化;(3)信息的质量和数量,目录指南型引擎质量上相对较高,主题型引擎数量上相对较多。

14.为什麽目录指南型引擎的主题查找效果不如主题型引擎?目录指南型引擎的主题检索只在对站点人工描述语言中进行,查找範围有限,所得结果通常是分类类名和网站名称,结果数量远不如主题引擎。

15.举出国内外目录指南型引擎典型代表各一个。目录引擎的国外代表是Yahoo!,国内代表有新浪网。

16.什麽是多元搜寻引擎?简述其工作原理。多元引擎是一种起检索中介作用的搜寻引擎。多元引擎本身没有存放网页信息的资料库。当使用者查询一个关键字时,它把查询请求转换成其他数个搜寻引擎能够接受的命令格式,并行地或者有选择性地访问这些搜寻引擎并查询这个关键字,处理这些搜寻引擎返回的结果,然后再返回给使用者。

17.举出国内外多元引擎典型代表各一个。国外多元搜寻引擎的代表是Dogpile,国内的代表是万纬等。

18.简述中外问搜寻引擎的主要区别。中文引擎可以使用英语等外文查找信息,外文引擎也可以使用中文;因而这两种引擎的区别不在于使用的语言,而在于收集和处理信息的侧重点。中文引擎主要收集和处理的信息是中文网页,查找中文资料的效果通常胜过外文引擎。反之,如果需要查找英文信息,直接使用境外英文引擎效果更好。

19.百度引擎的网页快照可以起什麽作用?百度伺服器通过程式收集网页时,在快取器中保留了网页备份。“网页快照”即是网页备份的连结。当点击检索结果标题没有结果时,“网页快照”可以用于帮助获取某些“消失”了的网页信息。

20.分别给出百度引擎限製于URL栏位、标题栏位和网站栏位的检索命令。他们分别是inurl, intitle和site.

21.简述百度引擎的三种逻辑运算符。逻辑与为空格,逻辑或为“|”,逻辑非为“ -”.

22.什麽是虚拟图书馆?虚拟图书馆是一种网路信息利用工具。它针对某一学科或领域的研究者的需要,将网际网路上与之有关的各种资源线索,包括与该学科或领域有关的研究机构、实验室、电子书籍、学术期刊、会议论坛、专家学者等的URL,进行系统地收集、核实并加以组织,以网站、网页或资料库形式提供给使用者流览或者检索。

23.简述使用虚拟图书馆的场合。使用虚拟图书馆查找信息的场合为:当时间短促,不允许流览由搜寻引擎查得的巨量的信息时;当希望看到比较可靠的网路信息;当希望对某个领域有个整体的、较全面的了解时。

23.能否以网上信息资源完全代替印刷型文献。哪一些文献的全文更适合从网上获得?目前,网上信息资源不能完全代替印刷型文献,尤其是学术型文献。近几年的国内学术期刊文献、部分国外学术期刊文献和部分专利文献,比较适合于通过网路获取。

24.通过搜寻引擎获得的未经审查的各种非正式出版物称为什麽文献?通过搜寻引擎获得的未经审查的各种非正式出版物称为灰色文献。

原理二

1 请比较手工检索和电脑检索的优缺点和适用範围。电脑信息检索的优点在于速度快,耗时少,查阅範围广,甚至可以查到国外刚刚出版的期刊论文的信息。电脑信息检索的优点还在于检索内容的专指性强,可以从文献型资料库中以文献的发表年份、文献中提及的人名等查找相关文献。电脑信息检索的缺点是追溯时间受到一定限製,检索费用比较昂贵,检索的时间也有一定的限製。电脑信息检索主要适用于已经数位化的近期文献信息和动态性信息的查找。手工检索的优缺点差不多正好与电脑信息检索的相反。手工检索的优点是时间检索和检索範围都不受限製。但是手工检索耗时多,效率低,检索入口少,因此查找效果往往不如电脑信息检索的好。手工检索主要适用于纸质印刷书刊文献,特别是早期文献信息的查找。

2什麽是资料库[1],它的结构由哪几部分组成?按照国际标準组织标準ISO/DIS5127规定,资料库是指至少由一种文档(file)组成,能满足特定目的或特定功能资料处理系统需要的资料集合。从使用者观点观察, 资料库主要由“文档——记录——栏位”三个层次构成。

3 什麽是文档?资料库包含哪几种类型的文档?从资料库的内部结构来看,文档的概念是指资料库内容的组织形式。一般地说,一个资料库至少包括一个顺排文档和一个倒排文档。顺排文档是将资料库的全部记录按照记录号的大小排列而成的文献集合,它构成了资料库的主体内容。在倒排文档中,记录的特征标识作为排列依据,其后列出含有此标识的记录号,使用倒排文档可以大大提高检索的效率。

4 什麽是记录?记录是文档的基本单元。它是对某一实体的全部属性进行描述的结果。

5 栏位有几种类型?栏位是记录的基本单元。它是对实体的具体属性进行描述的结果。

6 如何区别基本栏位和辅助栏位?基本栏位和辅助栏位的区别是是否与文献内容相关。基本栏位与文献内容相关,辅助栏位与与文献内容无关或者关系不大。

7 如何使用基于同一概念的方法扩展检索概念?基于同一概念的检索词的扩展法,可以寻找同一事物的学名和俗名等,寻找同一事物的简称、全称、音译意译以及反义词。如果是英语,可以寻找同一事物名词的单复数、不同词性、英美语的不同形式等。

8 以基于内容分析方法扩展检索概念具体有哪几种方法?基于内容分析的概念扩展法分为上位概念扩展法、下位概念扩展法和隐含概念扩展法。上位概念扩展法是分析检索对象的学科归属。下位概念扩展法是分析检索对象的学科分支。隐含概念扩展法是指文献或课题中,未用显而易见的方式表达,因而需要认真进行由表及裏、由此及彼的深入分析才能找出的主题。

9如何使用基于检索结果方法扩展概念?对初步检索结果进行分析,往往能够得到与课题相关的新的检索概念,将这些概念经过重新组合,就可以达到扩展检索结果的目的。

10 什麽场合可以使用截词方法?当某些英语检索词词干相同、词义相近,但词尾或词中间有变化时(多数英语单词的单复数变化和英美不同拼写形式),可以採用截词符,或称通配符扩展检索词。截词检索可以扩大检索结果。

12 使用截词检索应注意的哪些问题?使用截词方法时需注意四个问题:一是截词符要紧接在词干后面,截词符和词干之间不能有空格。二是避免将检索词的词干截得过短,一般应在三个字母以上。三是截词应该合理使用。一般不可能出现词尾变化的单词其后不必再使用截词。四是从希望出现的单词中取尽可能多的公共字母作为词干,以提高查準率。

13 什麽是布尔逻辑算符? 布尔逻辑算符一般有哪几种?规定检索词之间的逻辑关系的算符,称为布尔逻辑算符。布尔逻辑算符包括逻辑或(OR)、逻辑与(AND)和逻辑非(NOT)。

14 简述布尔算符(OR)的作用。布尔算符或(OR),是用来组配具有并列关系、概念相同或相近的词。OR算符的基本作用是扩大检索範围,增加命中文献量,提高检索结果的查全率,OR运算符还有一个去重的功能。在实际检索中,同一概念组面中含义相同或者相近的词,相互之间都使用OR运算符。

15 简述布尔算符(AND)的含义和作用。与(AND)运算符用来组配具有相互交叉限定关系的检索概念。其含义是检出的记录必须同时含有前后两个检索词。AND算符的基本作用是缩小检索範围,减少命中文献量,提高检索结果的查準率。

16 简述布尔算符(NOT)的作用。非(NOT)运算符是排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词。NOT算符的基本作用是缩小检索範围,提高检索结果的查準率。 17 优先算符“( )”有什麽作用?优先算符“( )”的作用是在多个逻辑符号混合使用时,改变它们的运算顺序。

18 什麽是位置算符?它在文献检索中起什麽作用?位置算符又称邻接算符,适用于两个检索词以指定间隔距离或者指定的顺序出现的场合。位置算符是提高检索查準率的一种重要手段。

19 栏位限製有什麽作用?适用于什麽场合?栏位限製是调整检索策略的一种重要的手段。多数检索系统对不指定栏位的检索词,通常在基本栏位中进行搜寻,如果想指定在题目等栏位中查找所希望的检索词,就需要使用栏位限製。栏位限製适用于在已有一定数量输出记录的基础上,通过指定栏位的方法,减少输出篇数,提高检索结果的查準率的场合。

20 需要扩大检索範围时,如何调整检索策略?需要扩大检索範围,调整策略的方法有:①减少“与(AND)”算符,增加同义词或同族相关词用逻辑或(OR)将它们连线起来;②在词干相同的单词后使用截词符“?”;③去除已有的栏位限製、位置算符限製(或者改用限製程度较小的位置算符)。

21 需要缩小检索範围时,如何调整检索策略?缩小检索範围,调整策略的方法有:①减少同义词或同族相关词;②增加限製概念,用逻辑与(AND)将它们连线起来;③使用栏位限製,或者限製检索词在指定的基本栏位出现,或者指定辅助栏位,限製结果的文献类型、语种、出版国家;④使用适当的位置算符;⑤使用逻辑非(NOT)算符,排除无关概念。

原理三

1 信息检索原理是什麽?信息检索的原理可以表述为将检索提问标识与存贮在检索工具中的标引标识进行比较,含有两者一致或信息标引的标识包含着检索提问标识的信息就是检索命中的信息。

2 什麽是文献的内容特征和外表特征?这两者有何区别?与文献信息主题内容没有关系或关系不大的信息称为文献信息的外表特征,例如,着者、着者单位、期刊名称、专利说明书的专利号、政府报告的报告号等。与文献信息主题内容密切相关的信息称为文献信息的内容特征。文献信息内容特征主要有各种形式的主题词和分类号。文献的标题因常常能够反映文献的主题,常被归入内容特征的範畴。内容特征和外表特征的区别是:与文献信息内容特征的关系密切的是内容特征,反之是外表特征。

3 什麽是检索语言?它在信息检索中起到什麽作用? 检索语言是用来描述文献的内容特征、外表特征和表达情报提问的一种人工语言。它是沟通信息处理人员和检索人员的桥梁。

4 检索语言的种类有几种?检索语言主要有以代码语言为特征的分类语言和以事物名称术语为特征的主题语言两大类。

5 什麽是分类语言?分类语言是在一定的哲学思想指导下,根据科学学科之间的逻辑归属关系,採用层次型或树杈型结构,列举人类所有的知识类别,并对每一知识分别标以相对固定的码,从而形成的类表。

6 国内通用的分类法有哪两种?它们的类号设定有什麽主要区别?国内通用两种分类法是《中国图书馆分类法》和《中国科学院图书分类法》。它们的类号设定的区别是《中国图书馆分类法》混合使用字母和数位,而《中国科学院图书分类法》使用纯数位作为类号。

7 什麽是分类法中的上位类、下位类和同位类?在《中图法》以及任何类似的分类表中,被区分的类称为上位类。相对地说,区分出来的类就是下位类。处于同一上位类下的同一层次的下位类称为同位类。

8 如何通过分类途径,使用检索刊物检索课题相关信息?利用分类途径检索文献,其检索步骤一般为:分析待查课题的主题内容,根据主题内容在类目索引中找到相应的类目,在分类表中提取分类号。在相应的检索工具中用该类号检索所需的文献,再根据所需要的文摘提供的出处查找原文。

9 多概念主题的文献如何确定分类号?给多概念课题确定分类号的方法,首先需要套用单概念课题分类方法,其次要区分属于并列概念课题还是套用性课题。如果是并列概念课题,凡是有主次者,应取其重点或主要研究对象归类;凡是无主次的,课题所涉及的类别都应该查找。如果属于套用性课题,套用于一个领域的应在所套用或受影响的类目中查找。套用于多个领域的则在该理论、方法、工艺等本身所属的类目中查找。

10 什麽是关键字语言?简述它的特征和适用场合?关键字是一种自然语言性质的主题语言。关键字法因直接以作者在文献中的用词作检索词,基本上不对词语加以控製。它适合于检索新近出现的信息。

11.什麽是叙词语言?简述它的特征和适用场合。叙词语言是以规範化科学名词为基础的一种主题法检索语言。叙词语言的两个最主要的特征是名词术语经过规範化,叙词与叙词可以组配。叙词语言适用于需要比较全面地查找以往的文献信息。

12 简述二次文献的类型。二次文献分为目录、题录、文摘三种。 目录是一批相关文献信息的着录集合,它以报道文献出版或收藏信息为主要功能的工具。题录是将图书、报刊等文献中论文的篇目按照一定的排检方法编排而成的,供人们查找篇目出处的工具。文摘是以精练的语言把文献信息的重要内容、学术观点、资料及结构準确地摘录下来,并按一定的着录规则与排列方式编排起来,供读者查阅使用的一种检索工具。

13 文献检索有哪几个步骤?共有六个检索步骤:明确课题要求、了解课题的知识背景、分析课题涉及的概念、选择使用的检索刊物、实施检索以及索取原文。

14 手工文献检索主要有哪两种方法?文献检索的常用方法有直接检索法和间接检索法两种:直接检索法即直接从报刊杂志中通过流览的方法从中获取所需信息的一种方法。间接检索法即通过检索工具的指引进行查找,获取所需信息的一种方法。

15 什麽是追溯法?它有什麽优缺点?追溯法又称回溯法,它是从已有的文献后面所附的参考文献入手,逐一追查原文的方法。其优点是:在没有检索工具或检查工具不齐全的情况下,借助此种方法,也可以查得一批有关文献信息。其缺点是:原文作者引用的参考文献是有限的,不可能列出全部有关文献,而且有的引用文献又与原文关系并不密切,参考价值不大。因此用此法查找文献比较费时,漏检和误检的可能性较大。16.什麽是常用法? 常用法是利用目录、题录、文摘或资料库等各种检索工具来查找文献的方法。

17.什麽是综合法? 综合法因综合使用追溯法和常用法两种方法而得名。具体方法是:先利用检索工具查出一定时期内的一批有用文献。然后利用这些文献后面所列的参考文献,再以追溯法查出前一时期内的文献,如此迴圈交替地使用上述两种两种查找方法,直到满足要求为止。

分析

1.按照交流渠道的不同,文献信息收集的方法可以有哪两种?按照交流渠道的不同,人文社科文献信息收集的方法可以分为正式渠道和非正式渠道两种。

2.什麽是通过非正式渠道收集信息的方法?通过非正式渠道(即从以非记录形式存在的信息源中)收集信息。就是通过同行个人间的信函或谈话交流、参加各类学术会议、参观展览会、实地考察访问某单位、开展调查研究等方式有针对性地获取与课题相关的口头信息、实物信息和调研资料。

3.什麽是正式渠道收集信息的方法?通过正式渠道收集信息的方法利用文献信息检索的方法,

4.简述通过正式渠道收集文献信息的一般方法。通过正式渠道收集文献信息的一般方法是:首先通过三次文献,即百科全书、年鑒、有关的资料手册、设计手册、学术机构指南、名人录等来收集相关的信息。其次根据拟定的查询线索和主题,通过手工检索工具或者电脑检索系统查找相关的文献信息。如果使用的是全文文献信息资料库,收集的步骤可以到此结束,如果使用的是书目信息类型的检索工具,则需要再次直接查找各种类型的原始文献,诸如专业核心期刊、学位论文、会议文献和报纸等文献收集信息。

5.简述根据已知书目信息获取原文的三个步骤。已知书目信息获取原文的步骤有三:一是根据书目信息中的特征词,判断出文献的类型;二是从已知的书目信息中选择查找馆藏的检索入口,例如责任者、书名、主题词等,使用公共书目查询系统(OPAC,WEBPAC,iPAC),以便确定查询文献的馆藏;三是办手续借阅。

6.就图书而言,含有析出文献的书目信息的特点是什麽?就图书而言,含有析出文献的书目信息的特点有二:(1)常常有两处着录作者信息,一处是析出文献的作者,通常是论文或者是章节的作者,另一处是整书的作者,通常是编者。(2)常常有两处着录题名信息,一处是析出文献的篇名或者章节名,另一处是整书的题名,通常是书名或者期刊名。

6.能否使用我校图书馆HORISON系统iPAC同时查找图书和期刊馆藏情况?可以。HORISON系统iPAC中的书目信息中既含有图书又含有期刊信息。

7.能否使用汉语查出 HORISON系统iPAC中的英语书目信息?可以。HORISON系统iPAC能够自动将汉语提问转换成英语,并给出相关的检索结果。

8.简述引用参考文献的作用。1) 着录参考文献可以反映论文作者的科学态度和论文具有真实、广泛的科学依据,也反映出该论文的起点和深度。2) 着录参考文献能方便地把论文作者的成果与前人的成果区别开来。3) 着录参考文献能起索引作用。4) 着录参考文献有利于节省论文篇幅。

9.正文部分引用文献的标注方法有哪两种方法?正文部分引用文献的两种标注方法,一种是顺序编码製,另一种是着者—出版年编码製。

10.简述文后参考文献的原则。正确着录文后参考文献的原则是:引用合理、格式规範、资料正确。

11.简述参考文献主要责任者的着录方法。着录参考文献的主要责任者时,着作方式相同的责任者不超过三人时,全部照录,超过三人时,只着录前三个责任者,其后加“等”或“et al.”。两个主要责任者之间用“,”隔开。个人着者採用姓在前,名在后的着录形式。着者的名可以用缩写字母,缩写名后不加“.”,欧美着者的中译名可以只着录姓。

12.请说明图书在文后参考文献中的着录格式。图书在文后参考文献中的着录格式为:序号 主要责任者. 书名[文献类型标识](供选择). 版本(第一版不做着录). 出版地: 出版者, 出版年. 页码

13.请说明图书析出文献在文后参考文献中的着录格式。图书中析出的文献在文后参考文献中的着录格式为:序号 析出责任者. 析出题名[文献类型标识](供选择).见: 原文献责任者. 原文献题名[文献类型标识](供选择). 版本. 出版地:出版者, 出版年. 页码

14.请说明期刊在文后参考文献中的着录格式。期刊在文后参考文献中的着录格式为:序号 析出责任者. 析出题名[文献类型标识](供选择). 刊名,出版年,卷号(期号):页码。

15.请说明报纸在文后参考文献中的着录格式。报纸在文后参考文献中的着录格式为:序号 析出责任者. 析出题名[文献类型标识](供选择). 报纸名称, 年-月-日(版次)

分布规律

专利、标準、档案由一个国家的专门部门管理,它们是国家专利局、国家技术监督局和国家档案局以及各地的相应机构。

学术论文由国家图书馆和中国科技信息研究所和学位授予单位共同收藏。

图书、期刊、会议录和报告等面广量大的文献主要由国家文献信息系统提供。

国家文献信息系统包括科技信息系统、社会科学院图书馆系统、高校图书馆系统和公共图书馆系统四个系统。

相关词条

相关搜索

其它词条