何谓检索语言_信息检索语言

何谓检索语言_信息检索语言文章目录检索语言的含义检索语言的特点检索语言的功能检索语言的分类检索语言的理论基础分类检索语言/分类法检索语言的含义传统意义上的检索语言仅指根据信息检索需要而创制的人工语言

信息检索比较偏

【一】 检索语言的含义

(什么是检索语言)(18华师简答)

检索语言:广义的检索语言泛指信息检索过程中涉及的人工语言和自然语言人工语言是根据一定的规则认为编制而成的检索语言,它有严格的使用规则,可用于表述文献的主要内容,建立信息检索系统。自然语言是人类交流时使用的语言,不受任何限制,未经加工和规范。狭义的检索语言是指根据信息检索需要,按照一定的规则对自然语言进行规范,并专门用于信息标引和用户检索的人工语言
在这里插入图片描述

传统意义上的检索语言——根据信息检索需要而创制的人工语言
广义的检索语言泛指——信息检索过程中涉及人工语言和自然语言
狭义的检索语言——仅指根据信息检索的需要,按照一定的规则对自然语言进行规范,并专门用于信息标引和用户检索的人工语言

人工语言是根据一定的规则人为编制而成的检索语言,可用于表述文献主要的内容,建立信息检索系统。
自然语言人类交流时使用的语言,不受任何限制,未经加工和规范,更符合用户的日常表达习惯。

检索语言的特点

作为沟通信息标引与信息检索两个过程而编制的人工语言,检索语言不但能够保证不同的标引人员描述信息特征的一致性,而且能够保证检索提问标识与信息特征标识的一致性
与其他语言相比,检索语言突出的特点是:
①具有必要的语义和语法规则,能准确地表达科学技术领域中的人和标引和提问的中心内容和主题;
②具有表达概念的唯一性,即同一概念不允许有多重表达方式,不能模棱两可;
③具有检索标识和提问特征进行比较和识别的方便性;
④既适用于手工检索系统,也适用于计算机检索系统。

检索语言的功能

在这里插入图片描述
(1)标引信息内容特征及某些外表特征,保证不同标引人员表达信息的一致性
信息标引是一个群体行为,只有共同依据检索语言,才能保证标引信息的一致性。

(2)对内容相同及相关的文献信息加以集中或揭示其相关性
检索语言采用等级结构、参照系统、轮排聚类法、范畴聚类法等显示概念之间关系的方法,来实现此功能。

(3)使信息的存储集中化、系统化、组织化,便于检索人员按照一定的排列次序进行有序化检索
检索语言将表达成千上万个信息主体概念的全部信息标识排列成一个有序的系统。
排列信息标识的方法包括:分类排列法,字顺排列法,分类和字顺结合的排列法

(4)便于将标引用语和检索用语进行相符性比较:一般来说,任何一种检索语言都有便于将标引用语和检索用语整体上进行相符性比较(即判断标引用语是否与检索用语完全相符)的功能。大部分检索语言还可以将标引用语和检索用语从局部上进行相符性比较(即判断标引用语是否与检索用语局部相符)。

检索语言的功能/性能

(2006年简答)
(1)标引信息内容特征及某些外表特征,保证不同标引人员表达信息的一致性
(2)对内容相同及相关的文献信息加以集中或揭示其相关性
(3)使信息的存储集中化、系统化、组织化,便于检索人员按照一定的排列次序进行有序化检索
(4)便于将标引用语检索用语进行相符性比较

检索语言的分类

(1)按描述文献的特征(文献外表特征和文献内容特征)

在这里插入图片描述
文献外表特征——以文献的篇名(题目)、作者姓名、出版者、合同号、报告号、引文等,据此作为文献标识和检索依据而形成的检索语言成为描述文献外表特征的检索语言,如题名索引,著者索引、报告号索引、合同号索引、存取号索引、引文索引等。

描述文献内容特征的检索语言(分类语言、主题语言和代码语言)

(2)按结构或原理(分类语言、主题语言、代码语言和引文语言)
在这里插入图片描述
分类语言,用分类号来表达各种概念,将各种概念按学科性质进行分类和系统编排,包括等级体系分类语言(体系分类法)分析——综合分类语言(组配分类法),它们统称为分类法系统。

主题语言是采用表达某一事物或概念的名词术语,用于标引、存储、检索的一种检索语言。包括标题词语言、单元词语言、叙词语言和关键词语言等,可统称为主题法系统。

代码语言一般只是就事物的某一方面特征,用某种代码系统来加以标引和排列。

引文语言是利用文献之间的相互引证关系而建立的一种自然语言,其标引词来自文献的主要著录项目。

(3)按信息标识的组合使用方法(先组式语言、后组式语言和散组式语言)
在这里插入图片描述

先组式语言表达信息主题概念的标识在编制词表时就已固定组配好,信息存储和检索人员在标引和查找信息时,依据词表选用组配好的主题标识进行操作。

  • 典型的先组式语言有体系分类法和标题词法
  • 先组式语言标识明确,系统性较好,适用于传统的文献单元方式的目录索引。但是表达专指概念和新概念较困难,灵活性较差,容易造成词表体积庞大,检索途径少。

后组式语言指在词表编制和标引信息时不规定表达主题标识的组配关系,在检索时再根据需要将各个标识进行组配,来表达较为复杂的主题概念。

  • 比较典型的后组式语言有叙词语言和单元词语言
  • 后组式语言能够以较少的词语来表达较多的概念和较为专指的概念,可以比较及时地表达新概念,概念容纳能力强。同时,可以实现概念的多向成族,多途径检索,能够灵活地扩大和缩小检索范围,因此其检索的灵活性好。采用后组式语言所编制的词表体积相对较小。但是编制和使用的难度较大,组配语义的明确性较差。

散组式语言是指对于复杂的主题标识,在词表中不组配,而是在标引阶段将表达主题概念的若干个标识,根据一定的的规则组配在一起的检索语言,如**《冒号分类法》**。

  • 散组式语言的性能与其检索标识是否分段轮排有很大关系。如果检索标识能够分段轮排,散组式语言就兼有先组式和后组式语言的主要优点。如果检索标识不轮排,性能和先组式语言差不多,只是其专指概念和新概念表达能力有所增强。

(4)按语言的规范程度,可分为人工语言和自然语言
人工语言有主题法、分类法和某些代码等种类。
自然语言是直接取自文献信息本身,不经加工或规范的词语或句子。

(5)按包括的学科或专业范围(综合性检索语言、专业性检索语言和多学科检索语言)
(6)

今天的文章何谓检索语言_信息检索语言分享到此就结束了,感谢您的阅读。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/62026.html

(0)
编程小号编程小号

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注