计算机信息检索基本算符?含义

电脑教程020

计算机信息检索基本算符?含义,第1张

1.布尔逻辑算符 规定检索词之间的逻辑关系的算符,称为布尔逻辑算符.布尔逻辑算符包括逻辑"或(OR)"、"与(AND)"和"非(NOT)". (1) 或(OR)运算符.也可用"+"代替,是用来组配具有同义或同族概念的词,如同义词、相关词等.其含义是,检出的记录中,至少含有两个检索词中的一个.OR算符的基本作用是扩大检索范围,增加命中文献量,提高检索结果的查全率,OR运算符还有一个去重的功能.在实际检索中,同一组面中含义相同的词,相互之间都使用OR运算符.另外,在使用截词方法检索具有相同词干的检索词时,这些词之间也自动地隐含了逻辑"或"的关系. (2) 与(AND)运算符.也可用"*"代替,用来组配不同检索概念.其含义是检出的记录必须同时含有所有的检索词.AND算符的基本作用是缩小检索范围,减少命中文献量,提高检索结果的查准率.在实际检索中,不同概念组面之间以及同一组面内的不同含义的词之间通常使用AND算符. (3) 非(NOT)运算符.也可用"-"代替,但在检索时建议使用NOT,以避免与词间的分隔符"-"混淆,NOT算符是排除含有某些词的记录的,即检出的记录中只能含有NOT算符前的检索词,但不能同时含有其后的词.NOT算符的基本作用是缩小检索范围,提高检索结果的查准率. 对于一个复杂的逻辑检索式,检索系统的处理是从左向右进行的.在有括号的情况下,先执行括号内的运算;有多层括号时,先执行最内层括号中的运算,逐层向外进行.在没有括号的情况下,And、Or、Not的运算次序,在不同的系统中有不同的规定. 2.位置算符 位置算符又称邻接算符(adjacent operators),适用于两个检索词以指定间隔距离或者指定的顺序出现的场合,比如,以词组形式表达的概念;彼此相邻的两个或两个以上的词;被禁用词或特殊符号分隔的词等.位置算符是调整检索策略的一种重要手段.按照两个检索词出现的顺序和距离,可以有多种位置算符,而且对同一种位置算符,检索系统不同,规定的位置算符也不同.例如,Compendex光盘数据库使用的位置算符"(N)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序可以颠倒)、"(F)"(表示其两侧的检索词必须在同一字段(例如同在题目字段或文摘字段)中出现,两词的词序可以颠倒)、"(S)"(表示其两侧的检索词必须在同一句子中出现,两词的词序可以颠倒)和"(W)"(表示其两侧的检索词必须紧密相连,除开空格和标点符号外,不得插入其它词或字母,两词的词序不可以颠倒)四种(如下所列). (1)(nW)算符:表示两个检索词(关键词、主题词)中间可以插入“n”个词,但他们之间的顺序不能颠倒,但允许有一空格或标点符号. (2)(nN)算符:表示两个检索词(关键词、主题词)中间可以插入“n”个词,且词序可以颠倒. (3)(F)算符:表示两个检索词(关键词、主题词)必须出现在同一个字段内,但两词的词序和中间插入的词数不限. (4)(S)算符:表示两个检索词(关键词、主题词)必须出现在同一个子字段内,但两词的词序和中间插入的词数不限. 注意:在不同的数据库中,位置算符检索功能及算符不同,应参看数据库的使用说明. 3.字段限制 字段限制也是调整检索策略的一种重要的手段.它是限定检索词必须在数据库记录中规定的字段范围内出现的文献,方为命中文献的一种检索方法.如果想指定在题名等字段中查找所希望的检索词,就需要使用字段限制.字段限制适用于在已有一定数量输出记录的基础上,通过指定字段的方法,减少输出篇数,提高检索结果的查准率的场合.由于字段限制采用前缀和后缀的形式,因此又称为前缀限制和后缀限制.例如Compendex光盘数据库基本字段限制的用法是在需要指定字段的检索词后加上后缀运算符"/"和段码.这个数据库辅助字段限制的用法是在需要指定字段的检索词(有时检索词须放在双引号内)之前加上段码和前缀运算符"=". 常用的字段代码有标题(TI)、文摘(AB)、叙词(DE)、识别词或自由词(ID)、作者(AU)、语种(LA)、刊名(JN)、文献类型(DT)、年代(PY)等.这些限制符在不同的数据库系统有不同的表达形式和使用规则. 4.截词符检索(Truncation、Wildcard Symbols) 利用检索词(关键词、主题词)的词干或不完整词形进行查找的过程为截词检索.它可以起到扩大检索范围,提高查全率,减少检索词(关键词、主题词)(关键词、主题词)的输入量,节省检索时间.尤其在英文检索系统中检索时,若遇到名词的单复数形式,词的不同拼写法,词的后缀变化时,均可采用此方法.截词的方式有多种,可以分为有限截词、无限截词和中间截词.

检索算符包括:布尔算符;截词检索符 ;限制检索符;位置逻辑检索符;加权检索。

它们的用法如下:

一、布尔逻辑算符:布尔检索式是采用逻辑加(“OR”或“+”)、逻辑乘(“AND”或“*”) 和逻辑非(“NOT”或“—”)等算符,指定文献的标引词中必须存在的条件或不能出现的条件。

采用“OR”(“+”)算符时,检索式写作A OR B(即A + B),表明数据库中凡有检索词A或者B,或同时有A和B的记录均为命中记录。使用逻辑或可连接同一检索组面的多个同义词、近义词和相关词,扩大检索范围。

采用“AND”(“*”)算符时,检索式写作A AND B(即A * B),表明数据库中同时有检索词A和B的记录才为命中记录。逻辑与可增强检索的专指性,缩小检索范围。

采用“NOT”(“—”)算符时,检索式写作A NOT B(即A — B),表明数据库中凡有检索词A而不含检索词B的记录才为命中记录。使用逻辑非可以排除不希望出现的概念,增强检索的准确性。

二、截词检索算符:在实际检索中,常遇到词干相同、词义相近的检索词,或同一词的单、复数形式,动、名词形式,英美拼法等,所谓截词检索,就是将通配符如“*”、“?”或“$”等等。

放在检索词中检索者认为合适的地方截断,用截断的词的一个局部进行检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中文献。

这样,检索者不必输入完整的检索词。截词方式有多种,按截断的字符数量分,有有限截断和无限截断;按截断的位置分,有后截断、前截断、中间截断。

三、限制检索算符:在编制检索式时,使用字段限制检索符可以限定检索词在数据库中出现的范围,对命中太多的记录再行筛选。

四、位置逻辑检索算符又称全文查找逻辑算符,相邻度检索算符,原文检索符。

由于布尔检索的“AND”运算要求AND两边的检索词在同一记录中同时存在才能命中文献,这就可能会引起误组配而造成大量误检,而位置逻辑检索是以原始记录中检索词与检索词间特定的位置关系为逻辑运算的对象,检索词用位置算符相连,就可以弥补布尔检索的缺陷。

此外,这种检索也不必依赖先组式词表而直接使用自由词进行检索,因而可使检索结果更准确。

扩展资料:

位置逻辑检索算符可分为:词位置检索算符、同句检索算符、同字段检索算符、同记录检索算符。

词位置检索算符:即要求检索词之间的相互位置满足某些条件而使用的检索算符,它们是: 

(W)与(nW)——(W)算符是“word”或“with”的缩写,表示此算符两边的检索词词序不能颠倒,两个词之间可有一个空格、或一个标点符号、或一个连接号。

(nW)则表示两个检索词之间最多嵌入n个词。例如,检索“CD-ROM”,则可用 ?S CD(W)ROM; 而用price(2W)inflation , 则可能检出price levels and inflation。

(N)与(nN)——(N)算符是“near”的缩写,表示此算符两边的检索词必须紧密相连,此间不允许插入其他单词或字母,但词序可以颠倒,而(nN)算符则表示在两个检索词之间最多可以插入n个单词,且词序可以颠倒。

(X)与(nX)——(X)算符要求其两边的检索词完全一致,并以指定的顺序相邻,中间不允许插入任何单词或字母;(nX)算符则表示两边的检索词之间最多可以插入n个单元词,但两边的检索词也必须一致。

词位置检索是很有用的检索技术,它可以规定词组中各词的前后次序,防止错误的搭配和输出;它也可以替代词组中的禁用词。

DIALOG系统有9个禁用词:AND、FOR、THE、AN、FROM、TO、BY、OF、WITH,如果在编制检索式时碰到禁用词,就要用词位置算符代替它。

同句检索算符:要求参加检索运算的两个词必须在同一自然句中出现,其先后顺序不受限制,可用算符(S)(S是Sentence的首字母)。同句检索放宽了词位置检索的要求,使表达同一概念但不满足词位置条件的文献也可以被检索出来,从而提高了查全率。

同字段检索算符:对同句检索条件进一步放宽,可以用算符(F)、(L)、进行同字段检索。(F)(“Field”的首字母)表示各检索词必须同时出现在文献记录的某个或某些字段中,词序可变,字段类型可用后缀符限定。

此外,还有同记录检索符,用位置算符(C)要求它两侧的检索词同在一条数据库记录中出现,如A(C)B,其检索效果与布尔算符的检索式A AND B相同。