文献检索的原理
Ⅰ 文献检索的意义和作用
学的发展是创造和继承的辩证统一过程。一个人的知识,
不外是从直接经验和间接经验两方面获得。直接经验的知识是自
己亲身实践所取得的知识;间接经验是古人或他人在实践中积累
的知识。这些古人的或外域的知识大都以文字记录下来,成为文
献。人不能事事直接经验,事实上多数知识都是间接经验的东
西,即从文献中接受古人或他人在实践中积累的知识。地球上存
在的各种地质现象和矿产资源,我们不可能都做到实地观察,更
多的是靠阅读文献,观察标本,以获得有关的知识和信息。另
外,许多地质现象会因为各种因素而受到破坏,甚至永久消失。
而地质观测结果的文字记录则具有长期保存价值。保存起来的这
些文献,对发展地质科学具有十分重要的意义。
对于地质工作者来说,每当在一个地区进行地质调查之前,
首先要了解前人在这一地区做过哪些工作。当着手一个课题的研
究时,也必须对该研究工作的历史、目前水平、存在的问题及发
展动向进行系统和详细的了解。也就是说,要掌握有关的地质信
息,查寻和阅读地质文献是一条重要途径。
当代经济的迅速发展,对矿产资源提出了更大的需求,从而
也使地质科学获得了前所未有的高速发展。当前,地质科学新的
领域在不断开拓,新的理论不断形成,新的信息不断涌现。当代
科学技术向地质科学的渗透,不仅使地质观察和研究日益向宏观
和微观两个方面深入,而且与传统地质科学相结合,产生了一系
列新的边缘学科。同时,地质调查的空间和研究的范围已从陆地
扩大到海洋乃至宇宙,从地表扩大到地球深部。
地质科学的高速发展,研究规模的迅速扩大,研究成果的大
量涌现,导致了地质文献数量的急剧增加。一方面,地质科学日益
专门化,专门学科的不断出现,学科之间相互渗透、相互交叉的
现象日趋强烈,致使各学科的文献愈来愈分散。另一方面由于条
件的限制,人们吸收和利用情报的能力并未得到相应的提高。庞
大的地质文献数量与人们特定的要求及有限的工作时间的矛盾更
加突出。在这数量庞大、类型复杂、文种多样、出版分散、重复
交叉严重、新陈代谢频繁的地质文献集合中,地质人员既难于找
到,更难于有效地利用与自己研究问题有关的特定情报。面对这
种局面,如何努力寻求一种更有效的查找文献和情报的技术和方
法,便成为一个亟待解决的问题。
文献检索,是以科学的方法,利用检索工具和检索系统,从
有序的文献集合中检出所需的信息的一种方法。它在科学交流中
是传递信息的一种重要手段,是人类为了合理地分发情报和充分
地利用情报而采取的一种重要的交流方式。文献检索不仅能够促
进信息资源的迅速开发和利用,而且能够帮助科研人员继承和借
鉴前人的成果,避免重复研究,少走弯路;节省查找文献的时
间,从而加速地质调查研究工作的进程。
第三节 地质文献检索的历史和发展
地质文献检索是在地质文献积累到一定程度时才出现,并随
着地质科学的发展和地质文献的不断增加而发展的。
不对望见谅。
我又找了一个不知可否:
一节 文献检索基本原理及其意义
文献生产的积累性、广泛性和文献利用的专指性,是文献检索的社会需求。为此,文献工作者便在搜集文献并使之有序化的同时,还编制各种检索工具或建立各种数据库等,这些都是使文献具有可检性以适应社会需求的业务基础工作。
一.文献检索及其原理
何谓文献检索?文献检索是一个查找文献的过程。《中华人民共和国国家标准情报与文献工作基本述语》(GB4884-85)对文献检索定义为:“从存贮的文献中找出特定文献的过程。”联合国教科文组织《文献与情报工作辞典》(1976年版)则定义为:“从一个文献集合中查找专门文献的活动、方法与程序。”两者表述方式虽有不同,但其内涵是一致的。即文献检索是从众多的文献群中查找出符合特定需要的文献信息的全部活动过程。从这个意义上讲,文献检索也就是信息检索(Information Retrieval)。按其查找对象的不同可分为三种不同类型的检索:
(一)书目检索,这是以检索工具(书目、索引、文摘、题录)为检索对象的一种检索。凡是查找某一主题(时代、地区、著者、文种等)有关文献的检索过程,均为书目检索。如“汕头经济特区投资环境研究都有哪些文献?”其检索结果是一条条的书目记录,包括论著题名、作者、文献出处等书目数据记录。
(二)事实检索(Fact Retrieval),这是以事实为检索对象,要求查出文献中的某些基本事实记录。如“汕头第一城与安居工程项目,李嘉诚先生各投资多少?他是否出席了项目签字仪式?”“汕头经济特区三资企业,生产高新技术产品最有发展前途的厂家有哪几家?”这不仅需要查出记录这些事实的资料,而且还要从中进行分析、比较,才能作出肯定性的回答。因此,事实检索也译作事项检索,属于数据检索的范畴。
(三)数据检索(Data Retrieval),这是以数据为检索对象要求查出文献中所载的专门数据,包括统计数据、计算公式、图表,以及物性数据、化学物质数据等。如“1994年汕头港进出口贸易额各多少?”“海湾大桥跨度有多长?建在妈屿岛上的铁索吊塔有多高?所用水泥、钢绳性能如何?”等,其检索结果都是经过高度浓缩可供直接利用的数据情报。
上述三种类型检索所提供的书目记录或事实性答案或数据,均来源于文献中的知识记录,属信息检索的范畴。文献检索是信息检索中最为主要的检索。
文献检索与一般的阅览既有联系又有区别。阅览是获取新知识的手段,也是文献检索筛选文献内容的过程,其中情报意识是关键。其区别在于:首先,所涉文献范围及其用书的目的有特殊需要与一般需要之别。文献检索是在文献海洋查找特定信息,强烈的情报意识支配着检索的全过程。而阅览往往是在一本书、一篇文章、一张报纸等个体文献中获取或多或少的新知识。其次,文献检索需要利用一定的工具,如书目、索引等检索工具;字典、词典、网络全书、手册、年鉴等参考工具书以及数据库等检索系统,否则事倍工半,甚至无从下手。一般的文献阅览只是遇到疑难问题时才利用参考工具书。其中利用工具书释疑解难的过程即是文献检索的过程。
文献检索与文献存贮有着密切的关系。存贮是为了有效的检索和利用;检索必须遵循文献存贮的方法;检索是存贮文献的逆过程,即用什么方法存贮文献信息,就用同样的方法把所需的文献或相关的知识,如数据、信息查找出来。这就是文献检索的基本原理。
Ⅱ 文献信息检索的原理是什么
文献抄信息检索具有广义和狭义两种含袭义。广义的文献信息检索包括文献信息的存贮和查找两个眨递过程。文献信息存贮是对文献信息进行收集、标引及著录,并加以有序化编排,编制成文献信息检索系统的过程。文献信息查找是从大量的文献信息中查找出用户所需的特定信息的过程,也就是把表达用户信息需求的提问特征,与检索系统中的标识进行对比,以便从中查出一致的信息。
随着计算机技术的发展,文献信息检索从手工检索进入计算机化阶段,并正向信息处理自动化和检索全文化、智能化、网络化方向发展,其检索内容、应用领域和普及范围也在迅速扩展。
由于用户的信息需求多种多样,信息检索技术也在不断发展变化,进而产生了多种类型的信息检索。
按检索对象可区分为数据检索、事实检索及文献检索;按检索方式区分为手工信息检索和计算机信息检索;
按检索要求区分为强相关检索和弱相关检索;按检索性质区分为定题检索和回溯检索;按检索的信息形式区分为文本检索和多媒体检索。
Ⅲ 简述信息检索的基本原理
信息内容分析与编码,产生信息记录及检索标识。
组织存贮,将全部记录按文件、数据库等形式组成有序的信息集合。
用户提问处理和检索输出。关键部分是信息提问与信息集合的匹配和选择,即对给定提问与集合中的记录进行相似性比较,根据一定的匹配标准选出有关信息。
它按对象分为文献检索、数据检索和事实检索;按设备分为手工检索、机械检索和计算机检索。由一定的设备和信息集合构成的服务设施称为信息检索系统,如穿孔卡片系统、联机检索系统、光盘检索系统、多媒体检索系统等。
信息检索最初应用于图书馆和科技信息机构,后来逐渐扩大到其他领域,并与各种管理信息系统结合在一起。与信息检索有关的理论、技术和服务构成了一个相对独立的知识领域,是信息学的一个重要分支,并与计算机应用技术相互交叉。
(3)文献检索的原理扩展阅读:
信息检索相关延伸:信息检索系统
1、存储职能。把有关信息的学科内容特征和外部特征著录下来,按一定次序排列组织起来,以便于查找各类信息资源。
2、检索职能。提供一定的检索手段,使人们按照一定的检索方法,及时、准确、全面地查找出所需信息资源。
3、报道职能。揭示某一时期、某一范围信息资源的发展状况。通过检索系统对信息资源的报道,了解学科的历史、现有水平和未来发展趋势。
Ⅳ 文献检索
第一章
1.信息:事物存在方式、运动状态及其特征的反映,是事物发出的信号、消息。
2.信息六大基本特征:载体依附性,无限共享性,永不枯竭性,开发增值性,应用时效性,存在普遍性。
3.情报:运用一定的媒体(载体),越过空间和时间传递给特定用户,解决科研、生产中的具体问题所需要的特定知识和信息。
4.文献:记录有知识的一切载体。
文献四要素:信息内容,信息符号,记录方式,载体材料。
5.信息源:个人为满足其信息需要而获得信息的来源。
信息源类型:
○按信息源存在形式:个人信息源,组织机构信息源,实物型,文献型,电子型;
○按信息源内容加工深度(文献级别):零次,一次,二次,三次文献。
文献型:图书,期刊,特种文献(学位论文,科技报告,专利文献,标准文献,产品样本,会议文献,政府出版物)
5.信息资源:人类社会信息活动中大量积累起来的以信息为核心的各类信息活动要素(信息生产者,信息技术,设备,设施,资金等)的集合。
信息资源的构成要素:信息生产者,信息,信息技术。
6.信息,信息源,信息资源关系:
信息源是信息资源的源,是先于信息资源的,信息资源是高质量,高纯度的信息源。
7.信息文化:在现代社会活动中依据信息技术的广泛应用特征而形成的一种新文化形态。
8.信息素养:具备信息素养的人,能够充分认识到何时需要信息,并能有效地进行检索、评价和利用所需的信息。
9.医学信息素养的内涵:信息意识,信息知识,信息能力,信息道德。
○信息意识:信息在人脑中的反映即人对各种信息的自觉心理反应,反映人在信息活动过程中对信息的认识,态度,价值趋向和一定需求。
○信息知识:与信息有关的理论,知识,方法。
○信息能力:有效利用信息技术和信息资源获取信息、加工处理信息以及创造和交流新信息的能力。
○信息道德:在信息获取、使用、创造和传播过程中应该遵守一定的伦理规范。
10.信息检索:
○广义概念:包括信息的存储和信息获取两个过程。
○原理:通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。
○类型:文献检索,事实检索,数据检索。
○作用:是信息素养教育的主要内容;
是创新人才应具备的基本技能;
是科学研究的重要环节;
是开发信息资源的有效途径;
是科学决策的前提。
第二章
1.信息检索:充分利用信息检索系统,依照一定的检索语言和规则对文献信息进行标引,按照检索系统提供的检索途径,采用先进的信息检索技术,制定合理有效的检索策略,快速、准确、全面地检索出所需的文献信息。
2.计算机信息检索系统组成:计算机硬件,计算机软件,数据库。
3.数据库的组成:文档、记录、字段。
数据库类型:书目,事实,数值,全文,图像。
4.信息检索语言:为信息的加工,存储和检索的共同需要而编制的专业语言,是表达一系列概括信息内容和检索课题内容的概念及其相互关系的一种概念标识系统。
5.分类语言:运用逻辑分类原理,按文献内容的学科、专业集中文献,从知识分类的角度揭示各类文献在内容上的区别和联系,将性质相同的文献聚集在一起,性质相近的联系在一起,性质不同的予以分开。
优点:能获得较高的查全率;
缺点:专指性较差,不适合专深主题和多位概念的检索。
6.主题语言:以高度概括的词语揭示文献的主题,并以此为标识组织检索系统的语言。
优点:专指性强,直观、直接,适用于特性检索,查准率高;
缺点:不能集中同一学科、同一专业或族性事物的文献。
7.叙词:能表达文献主题并经过严格规范化处理的词语,也就是俗称的“主题词”。
8.关键词:直接从文献的标题、文摘或全文中抽取具有实质意义、能表达文献主题概念,未经规范化处理的自然语言词汇。
优点:表达主题直观,检索入口多,能及时反映新事物新概念;
缺点:词汇未经规范,质量难以保证,影响文献检索的查准率和查全率。
9.信息检索途径:分类途径,主题,关键词,著者,题名,号码,其他途径。
10.信息检索技术:布尔逻辑检索,截词检索,位置检索,限定字段检索。
11.信息检索策略步骤:
1.分析检索课题,明确目的和要求;
2.检索系统和数据库选择;
3.选择检索途径、确定检索标识;
4.编制检索表达式、调整检索策略;
5.获取原始文献。
12.查全率:表示检出的相关文献与全部文献库中实际存储的相关文献的比例。
提高查全率的措施:
1.尽量采取主题词与关键词相结合进行检索;
2.主题词检索时要进行扩展检索和使用全部副主题词检索;
3.分类检索时要进行扩展检索和全部复分检索;
4.删除某个不重要的概念组面,减少AND运算;
5.多用同义词进行逻辑或检索;6.采用截词检索。
13.查准率:表示检出的文献中所需要的相关文献所占的比例。
提高查准率的措施:
1.采用规范化的主题词与副主题词组配进行检索,少用或不用自由词;
2.采用限定主要概念主题词字段的加权方式检索;
3.增加概念组面,用AND运算符进行连接;
4.用NOT运算符排除无关概念;
5.限制检索字段,如文献类型、语种、作者、刊名等;
6.运用放宽位置运算符。
第三章
1.搜索引擎:Internet上具有查询功能的网页的统称。
○结构:搜索器、索引器、索引数据库、检索器、用户接口。
○基本原理:1.信息的采集与存储;2.索引数据库的建立;3.检索界面的建立;4.检索结果的相关性处理。
○评价:1.网页覆盖率;2.返回结果的准确性; 3.重要信息返回的过滤;4.网页更新速度;5.搜索服务的响应时间;6.搜索服务的系统稳定性。
第四章
1.全文检索:以文献所含的全部信息作为检索内容的检索方式。
第五章
1.Pubmed检索系统:美国国立医学图书馆所属国家生物技术信息中心研制开发的网上数据库。
Ⅳ 文献检索原理包括的过程
文献生产的积累性、广泛性和文献利用的专指性,是文献检索的社会需求。为此,文献工作者便在搜集文献并使之有序化的同时,还编制各种检索工具或建立各种数据库等,这些都是使文献具有可检性以适应社会需求的业务基础工作。
一.文献检索及其原理
何谓文献检索?文献检索是一个查找文献的过程。《中华人民共和国国家标准情报与文献工作基本述语》(GB4884-85)对文献检索定义为:“从存贮的文献中找出特定文献的过程。”联合国教科文组织《文献与情报工作辞典》(1976年版)则定义为:“从一个文献集合中查找专门文献的活动、方法与程序。”两者表述方式虽有不同,但其内涵是一致的。即文献检索是从众多的文献群中查找出符合特定需要的文献信息的全部活动过程。从这个意义上讲,文献检索也就是信息检索(Information Retrieval)。按其查找对象的不同可分为三种不同类型的检索:
(一)书目检索,这是以检索工具(书目、索引、文摘、题录)为检索对象的一种检索。凡是查找某一主题(时代、地区、著者、文种等)有关文献的检索过程,均为书目检索。如“汕头经济特区投资环境研究都有哪些文献?”其检索结果是一条条的书目记录,包括论著题名、作者、文献出处等书目数据记录。
(二)事实检索(Fact Retrieval),这是以事实为检索对象,要求查出文献中的某些基本事实记录。如“汕头第一城与安居工程项目,李嘉诚先生各投资多少?他是否出席了项目签字仪式?”“汕头经济特区三资企业,生产高新技术产品最有发展前途的厂家有哪几家?”这不仅需要查出记录这些事实的资料,而且还要从中进行分析、比较,才能作出肯定性的回答。因此,事实检索也译作事项检索,属于数据检索的范畴。
(三)数据检索(Data Retrieval),这是以数据为检索对象要求查出文献中所载的专门数据,包括统计数据、计算公式、图表,以及物性数据、化学物质数据等。如“1994年汕头港进出口贸易额各多少?”“海湾大桥跨度有多长?建在妈屿岛上的铁索吊塔有多高?所用水泥、钢绳性能如何?”等,其检索结果都是经过高度浓缩可供直接利用的数据情报。
上述三种类型检索所提供的书目记录或事实性答案或数据,均来源于文献中的知识记录,属信息检索的范畴。文献检索是信息检索中最为主要的检索。
文献检索与一般的阅览既有联系又有区别。阅览是获取新知识的手段,也是文献检索筛选文献内容的过程,其中情报意识是关键。其区别在于:首先,所涉文献范围及其用书的目的有特殊需要与一般需要之别。文献检索是在文献海洋查找特定信息,强烈的情报意识支配着检索的全过程。而阅览往往是在一本书、一篇文章、一张报纸等个体文献中获取或多或少的新知识。其次,文献检索需要利用一定的工具,如书目、索引等检索工具;字典、词典、网络全书、手册、年鉴等参考工具书以及数据库等检索系统,否则事倍工半,甚至无从下手。一般的文献阅览只是遇到疑难问题时才利用参考工具书。其中利用工具书释疑解难的过程即是文献检索的过程。
文献检索与文献存贮有着密切的关系。存贮是为了有效的检索和利用;检索必须遵循文献存贮的方法;检索是存贮文献的逆过程,即用什么方法存贮文献信息,就用同样的方法把所需的文献或相关的知识,如数据、信息查找出来。这就是文献检索的基本原理。
文献存贮与检索示意图:
存贮过程 检索过程
文献内容 检索需要
│内容 │内容
↓分析 ↓分析
内容概念 内容概念
│文献 │
↓描述 ↓
信 息 检 索 语 言
↓ ↓
检索标识 提问标识
↓ ↓
Ⅵ 情报检索的基本原理是什么
答:指知识的有序化识别和查找的过程。虽然情报的查找早就萌芽于图书馆的参考工作,但“情报检索”一词直到20世纪50年代初才出现。它是现代记录下来的知识急剧增长而需要给以合理的存储、人们查寻的着眼点更多地指向包含在文献中的情报而不是文献本身,以及电子计算机应用到图书情报工作中来使人们拥有强有力的情报处理手段而导致出现的新名词。因此,广义的情报检索包括情报的存储与检索,而狭义的情报检索仅指后
者。
情报检索按其存储与检索的对象——不同类型的情报而分为:
①书目检索,例如“有关海底隧道有些什么文献?”(见文献检索);
②事实检索,例如“世界最长的海底隧道是哪一条?”;
③数值检索,例如“某海底隧道有多长?”;
④文献全文检索,所检索出来的是有关文献的全文,可能答例如“某文献全文中有哪些句子提到了海底隧道?”的问题。
按其情报存储的载体和实现查找的技术手段,情报检索可分为:
①手工检索,即通过检索者对印刷型的检索工具进行手翻、眼看、脑子作出判断而进行的。这种检索方式的优点是检索者可以边查边思考,随时修改检索策略。缺点是效率低。
②机械检索,即利用探针或检索器件,对代表检索标识的穿孔卡片进行选取。这种机 械的扫描大大提高了检索效率。
③光电检索,即把检索标识变成黑白点矩阵或条形码,存储在缩微胶片(卷)上,利用光电效应, 通过检索机进行查找。
④计算机检索,即把情报及其检索标识转换成电子计算机可以阅读的二进制编码,存储在磁性载体上,由计算机根据程序进行查找与输出。根据检索者同计算机进行的不同通信方式,计算机检索又可以分为脱机检索、联机检索及多机网络化检索等。
情报检索研究的范围和内容,包括情报检索理论、检索语言、检索系统、检索策略及检索服务等方面的研究。
Ⅶ 什么是信息检索其原理是什么
目前在
图像检索
方面主要采取了两种方法,即基于文本的图像检索和
基于内容的图像检索
。文本的图像检索也就是基于关键字的检索,通过对图像进行注释产生图像索引,简单易行,而基于内容的图像检索,主要是把图像的视觉特征,例如颜色、纹理结构和开关、空间等,作为图像的内容表示,进行匹配、查找、即实现基于内容的图像检索.
Ⅷ 信息检索的基本原理
信息检索有广义和狭义的之分。广义的信息检索全称为“信息存储与检索”,是指将信息按一定的方式组织和存储起来,并根据用户的需要找出有关信息的过程。
狭义的信息检索为“信息存储与检索”的后半部分,通常称为“信息查找”或“信息搜索”,是指从信息集合中找出用户所需要的有关信息的过程。狭义的信息检索包括3个方面的含义:了解用户的信息需求、信息检索的技术或方法、满足信息用户的需求。
(8)文献检索的原理扩展阅读:
信息检索四要素:
1 信息检索的前提----信息意识:所谓信息意识,是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力,从而判断该信息是否能为自己或某一团体所利用,是否能解决现实生活实践中某一特定问题等一系列的思维过程。
2.信息检索的基础----信息源:信息源定义:在联合国教科文组织出版的《文献术语中》,将信息源定义为:个人为满足其信息需要而获得信息的来源,称为信息源。
3、信息检索的核心----信息获取能力:通过熟练使用检索工具来了解各种信息来源的效果。
4.信息检索的关键----信息利用:获取学术信息的最终目的是通过对所得信息的整理、分析、归纳和总结,根据自己学习、研究过程中的思考和思路,将各种信息进行重组,船造出新的知识和信息,从而达到信息激活和增值的目的。
参考资料来源:网络-信息检索