计算机信息检索的基本方法与策略
计算机信息检索实质上就是由计算机将输入的检索策略与系统(数据库)中存贮的文献特征标识及其逻辑组配关系进行类比、匹配的过程。以下简要介绍信息检索的步骤:
1. 明确检索目的,弄清信息需求
①检索是为了立项、申报成果,还是为了了解学科的最新进展等等;②所需的文献量;③明确所需文献的语种、年代范围、类型、作者等;④课题涉及的学科范围;⑤课题的主要内容。
2. 选择数据库,确定检索途径
了解数据库收录学科领域、收录的文献类型、时间范围、基本索引及辅助索引、提供的检索途径及检索标识的特点。
3. 确定课题的概念组面和检索标识
检索课题,尤其是内容较复杂时,应明确组成课题内容的几个概念组面,并通过一定的逻辑组配形成一定的复合概念或概念关系来表达用户的信息需求。比如说:“抗菌腈纶纤维”这一课题就涉及三个概念组面,即“抗菌”、“涤纶”、“纤维”。
确定了课题的概念组面,还须将其转换成相应的为系统所识别的检索标识,检索标识的表示应符合切题性和与检索系统匹配性两个要求。 仍以上述课题为例,比如“抗菌”一词在英文中表示方法有多种,如antimicrobial、anti-microbial 、bacteria-resist、anti-fungal、anti-bacterial等,就是同位概念的把握,也是与系统匹配性和查全方面需要注意的问题。其它“涤纶”、“纤维”两个组面同样,依此类推。
4. 拟定检索提问式,确定具体检索策略
检索提问式,是指计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。一般来说,因绝大多数数据库中,语种、时间、文献类型等限制均可实现菜单式选择,所以编辑的检索式中主要涉及的与课题有关的关键词。以下仍以上述课题为例:
中文检索提问式可拟为:(聚酯 or 涤纶 or 聚对苯二甲酸乙二醇酯)and (抗菌 or 抑菌) and 纤维;
英文检索提问式可拟为:(polyethylene terephthalate or poly(ethylene
terephthalate) or PET) and (antimicrobial or anti-microbial or bacteria-resist or anti-fungal or anti-bacterial ) and fib*(备注:*为截词符)
但是,不同数据库标引方法、检索途径和操作符(逻辑算符、位置算符)是不同的,同一数据库内不同的检索途径对于算符的识别亦有区别。那么就是说,在制定了检索提问式后,关键是如何将其“翻译”成所检系统(数据库)相应的检索语言,比如“中文科技期刊数据