如何提高文献检索的查全率
文献检索是科研的基本功,
阅读文献是科研人员获取科研信息的重要途径。评
价文献检索质量的两个最重要的指标是查全率和查准率。
查全率指的是检出的相
关文献量与系统文献库中相关文献
总量的比率,它反映该系统文献库中实有的
相关文献量在多大程度上被检索出来。
查全率
=
检出相关文献量
/
文献库内相关文献总量× 100%
。查准率指的是
是指检出的相关文献量与检出文献总量的比率,
是衡量信息检索系统检出文献准
确度的尺度。
查全率
=
检出的相关文献篇数
/
检出的全部文献篇数× 100%。
查全率与查准率
在一定程度上是成反比关系的,为了提高查全率就要以牺牲部分查准率为代价,
反之亦然。
在不同的情况下,
对二者的要求也不同,
有时
文献的全面更为重要,
这时就要以提高查全率为重点,
有时希望找到的文献准确率更高,
就以提高查准
率为重点。
1
检索词的转换。
常见的转换是
同义词、近义词、相关词、单复数及缩写形式,
如果是动词还有可能有不同的时态
。每
一个检索词都有可能有多种表达形式,
如果是由英文翻译过来的还有可能有多种翻译方法,
所以应该尽可能找全检索词
的所有同义词、近义词。相关词指的是与检索
词不是同一个意思但是有关联的
词。如,
META
分析的同义词包括元分析、荟萃分析、
meta-analysis
,近义词包
括系统综述,相关词为循证医学。
前列腺癌的缩写可能是
Pca
等等。值得注意
的是,
在检索中文文献的时候,
有必要把英文的全称和缩写也作为检索词,
因为
有些中文文章中是直接用英文词汇表示
的。
2
使用截词符
。
虽然从理论上来说我们找到所有的同义词和近义词可以扩大检索
结果,
但是要想做到这一点是相当困难的。
这时可以利用截词符来帮忙。
一般用
的截词符是
“?”和“*”,
在不同的数据库中表示的意思有所不同,常见的意
思是“?”表示
0-1
个字符,而“*”表示多个字符。
3
使用上位词,
即指代范围更广的词。
有些检索系统有主题词途径,
则可以选用
上位主题词。例如水果是苹果的上位词,
prostatic neoplasm
的上位主题词是
prostatic disease