查看完整版本: [-- 【转贴】浅谈文献检索中的德才兼备问题 --]

啄木论坛 -> :: 文献科研 :: -> 【转贴】浅谈文献检索中的德才兼备问题 [打印本页] 登录 -> 注册 -> 回复主题 -> 发表主题

车驰 2006-09-19 20:44

【转贴】浅谈文献检索中的德才兼备问题

首先要对本文所谈论的“文献检索”的特点作一下解释,本文涉及的文献检索与一般意义下的文献检索的目的是一致的,即从浩如烟海的繁多卷帙中挑选出与检索者当前的主题相适应的文献。早年在文献不多或文献检索的普遍平台尚未建立之前,作者对文献的依赖性不十分突出,因此更多的是具有原创精神的著作。但是当这些原创渐渐集腋成裘,而裘又趋于流行后,人们发现自以为原创的作品也许在多年前就已有人深入思考,自己的这点浮浅见识相形见绌,为了避免这类所谓的“原创冲突”或“原创浪费”,人们意识到建立过往原创集成的必要性。这点中华民族的老祖宗早已意识到,早在两千多年前就有人汇总成类似的编目。但要说到科学性与西方文明的继承者发明的编目方法相去甚远,简直不可同日而语。中华民族近代在科学发展水平上的落后在一定程度上可以归咎于学科分类(文献分类是其极为重要的成分)无法与科学的发展现实相适应,而西方文明在这一点上是与时俱进的,尽管或多或少的呈现一点落后,但不久就意识到并迎头赶上。总之,学科范畴的分类必须可以囊括当前学科的实际发展现状,这对于文献的分类尤为重要。

  同时本文的“文献检索”又特别指通过“非常规”手段,即利用尽量低的成本在尽可能短的时间内得到尽可能多的与主题相关的文献资料(最好是原文全文,加工后的数据库、权威的综述、含足够信息的摘要也勉强可以)。非常规是指不是通过等价交换,即不通过正当的完全尊重知识产权的行为得到(当然免费开放入口另当别论)。目前在网络上主要是借用密码、代理、获取开放入口等。论坛中的“文献检索”实质是文献资源入口的检索(免费或变相免费)。但本文在讨论此狭义的或变性的“文献检索”前,还是正本清源,从其广义开始切入正题。

  文献检索的时效性和全面性是两个最高的也是最鲜明的特点。每个作者都希望在尽可能短的时间内(或尽量少的步骤)得到尽可能多的切中主题文献,这是高级阶段所要追求的目标,而对于初学者首先是要界定一个基本的检索范围,也就是明确符合全面性标准的尽可能小的文献集合。因此全面性才是初学者应该首先应该考虑的问题,但要达到全面性就要求作者对所有的或现阶段认为相关的(后者比较常用)资源进行有效的分类,并掌握每一类别中的资源状况。资源的宏观分类包括:文献(学位论文、杂志论文、网络论文、会议论文)、信息资料(原始数据、统计结果、信息发布)、数据库(数据收集加工)、搜索引擎。

    其中杂志是论坛中关注程度较高的资源,就学术性杂志而言,据估计全世界总数不下几十万种。如此多的杂志种类要全部收集齐全是非常困难的,而且没有必要,会出现如此众多的杂志有其历史原因,也有利益驱动因素。有些杂志在信息化并未普及的时代就存在,而且曾经较为重要,但现已没落,却没有消失,依然费力的坚持。另外一些随着所函盖学科的更替而变换内容,地位一落千丈。但更多的杂志,是一些(为数还不少)可以看作是高级杂志(SCI收录)的二级资料消化杂志,通过辗转腾挪,变化面孔毫无羞耻也实属无奈的反复演绎同一出老戏。细想一下,全世界每年如此多的杂志版面等待填充,就像待嫁的新娘,一旦泛滥,一些姿色平庸、素质低下的就难觅佳婿,毕竟这世界优秀的男子不可能比比皆是,留下传奇的就更是稀有(引用率极高的文献)。

  因此有必要选择一些“较为”优质(注意:不是优质,否则容易遗漏)的杂志进行名录汇编。笔者推荐SCI收录的杂志,即ISI全部杂志目录,共11754种杂志。如此是否可以代表当前文献的全体,是否会有遗漏,这是笔者曾经思考的问题。但经过考察认为既然绝大部分的文献引用来自这些杂志,同时笔者曾经试验过一些主题后发现这些杂志的文献足以函盖相关要点,甚至还有冗余,由此可以认为这样的一个杂志名录已经足够。该目录将杂志分为22个大学科,这样的学科分类对科研的实用性不大,但对于初步筛选有一定意义,如选定生命科学相关杂志,就可以剔除其他诸如物理、环境科学、空间科学、经济等。这样可以在保证全面性的条件下尽量减少工作量。这样的初筛是必要的,作为学术研究者可能有绝大部分的杂志可以肯定不会涉猎,甚至是经过初筛后的杂志也有大部分不会去阅读,否则以这样的心猿意马难以成为优秀科学研究者(除非是科技情报工作者),毕竟文献检索只是科研的一个基本步骤而已。

    另外笔者推荐PUBMED中的杂志收录表,List of PubMed Journals,通Lookout得到,该表到目前为止收录4471种杂志,并给出各种杂志被各大数据库收录的详细列表,更加切合实际应用。另外还有NLM(美国国立医学图书馆)2002年版本收录3799种医学杂志,并且有非常详细的学科分类。另有一种划分为169个学科分支的目录,收录8088种杂志。总之对于初步筛选22种学科分类已经足够而简便,但对更为专业的作者可以使用更详细的划分。生物医学所占据的比例处于明显的优势,基本上在50%以上,但这只能说明生物医学的研究是当前热点,却不能认为其凌驾于其他学科之上,而且有些泡沫学科的味道,文献的重复率太高,突破性、原创性的文献数量太少。因此本人认为对文献资源的精简的意义远远大于对其单纯的占有,过度的占有文献的欲望有时会让你头脑中的原创意识渐渐淡薄,而出现“文献中毒现象”,国内的科研工作者普遍的有意无意的出现中毒症状,有些已经病入膏肓。

    在进行初筛后确定针对性的杂志目录,这点对一个成熟的科学工作者是非常重要的,既可以避免盲目,更有助于掌握全面的资料,轻松应对文献检索问题。那么接下来的事就是对号入座,寻找这些杂志可靠的链接,绝大多数的杂志均为综合文献数据库收录,为大家熟知的国外收费的数据库如ScienceDirect、Elsevier、Blackwell、Ebsco、Ovid、Ingenta、Springer、WileyInterscience、Kluwer等,一些出版集团如Nature、OUP、AHA等不予详列,免费的如PUBMED、Highwire、BMJ等,国内的CNKI、万方、维普三大文献数据库等,这些数据库入口的寻找是当前论坛的主要任务,基本上还是通过密码、代理、开放入口三个途径。制作个人的杂志库,在每一杂志后填入链接地址及入口途径,这是一个积累的过程,这个过程的时间长度与你所投入的精力呈反比,但也有一定技巧。一般可以分为两类获取方式,一类属于自力更生型,通过对已往高手经验的学习、实践、精简,利用检索工具发掘资源。另外一类属于寄生型,通过在各大论坛中发掘他人发布的资源并验证后汇总并不断更新。但两者往往结合使用,效果明显提高。对于有意成为此中高手者,总结已往检索高手发表的经验集并加以发挥是必要途径。本人曾经在论坛中看到过的如东北石头、Little0、丁香园、Bioon、黄教授、Hashimoto、Sunprivate等的检索文集,另有许多的代理文集,一些零散的检索经验有时会收益颇多,一定要收集并总结、精简,这个循序渐进的积累过程非常必要,快则一两月,慢则一年甚至更长。

    学习前人检索、代理经验一般可以在国内的丁香园、Bioon、Biooo、星荧、红军长征、鸭绿江、清风小木虫等论坛中寻找。笔者认为在获得初步的资源入口方法并可以基本满足检索要求后不必一味热衷于吸附密码、代理资源,而应该从头开始扎扎实实的学习基本知识,趁早退而结网,不必到时临渊羡鱼。有人认为仅仅丁香园一处的密码、开放入口发布的数量就已经相当可观,资源不是紧缺而是泛滥,没有得到有效管理和控制,重复、灌水的成分也较多,甚至有人以提高论坛中的积分替代对检索基础能力的提高,这样做在对待文献检索的严肃性上存在一定问题,也难以取得本质性的进展。

随着近年来网络技术的发展、网络知识的普及,应用性科技情报工作的重点也已转移到网络上,涌现出大批网络情报方面的高手,同时这些知识也渗透到科研工作者群体中,孕育出网络时代的文献检索精英,这部分学者学有专长,对文献检索亦有独到的见解,两者相互推进更是如虎添翼。但在普及观念的同时带动群体提高水平,也带来负面影响,大量的密码流失、代理失效、开放入口关闭。我们用常识推理,每个密码都必定有其所属,可以是单位或个人,一般单位居多,我们所公布的大多是集体密码,如无IP限制,直接登陆就可,如同涓涓溪流汇入浩浩江河,自然不值一提,而且集体密码多是包库,也不会勤于监测流量,数据库拥有方对于个别的陌生IP登陆也并不在意,毕竟是抓主要收入。但现在的情况与几年前大为不同,知道从网络途径得到密码免费登陆的人数呈几何级数增长,单从丁香园来说,注册人数17万多,就算1/3的人知道并感兴趣,也有5万多人,可想全国会有多少人每天在用免费的CNKI(使用率最高)密码,我想扣除所在单位订购CNKI的人员的数目,应该也有成千上万人吧。再看看现在已经发布的能用的CNKI密码的个数,可能在100个以下,平均一下,每个CNKI密码有上百人登陆,就算时间错开,而且不是每天都使用,一个密码在同时应该也会有数十人在免费使用,难怪有些密码每次登陆时总是显示“最大登陆数已满,请稍后再试”的字样,这样的密码生存时间不会太长,过段时间你登陆时就会显示“用户密码错误”或“IP不在指定范围,请与管理员联系”。现在这样的绿色密码(无IP限制,放之四海皆可的密码)数量大大减少,可大家还在不断的挖掘,大有涸泽而渔的趋势,当然鱼是永远也不会捕尽的,但数量是急剧下降,趋向于0。而万方、维普的密码失效都很快。国外的著名杂志或数据库的密码有效时间不十分一致,与单位时间内异常登陆量的直接关系也不密切,但仍可以找到一定的反比关系,如Nature、Cell等的密码死亡速度非常快,但罕有人至的杂志密码的生存时间可以与天同寿,只要该单位订购、密码未作更改就会有效。对国外密码的有效时间长度影响较大的是数据库或杂志的维护者的监测严密性,但监测总是基于一定水平的异常登陆事件,所以间接与登陆情况有关。

    而要控制登陆情况显然是不现实的,一般刚刚拿到密码很多人都会去试探一下,一旦有效感兴趣的就会在短时间内多次登陆,只有少部分人会有策略的进行试探,相反大多数人使用的是原始IP,如果数据库管理系统机警一点肯定会采取措施,致使大批密码前仆后继,走向死亡的深渊,包括大量的高权限的密码。另外有些人拿到密码后大批量下载文献也导致密码速死,更有恶劣者擅自修改密码,根本不具备基本素养和常识,这是道德和智商的双重缺陷。总之登陆的方式欠缺策略、登陆的数量比较巨大、登陆后的恶劣行为任何一点都会导致密码失效。

    近来另一状况也应该引起注意,各单位在网络中发布密码页的越来越少,很多以前可以打开的密码页无法找到链接,各单位网络信息管理者的基本素质在提高,魔高一尺,道亦高一尺,其实魔道本是一家,随着信息交流的普遍化,魔亦是道,道亦是魔。现在绝大多数的数据库渐渐在向限定IP的直接入口或限定IP的密码,即使发布密码页也只在校园网内部。虽然现在有些密码仍然有效,以后也肯定会继续存在绿色密码这种形式,但这类密码的获得将更加艰难,IP限制的情况必然是大势所趋,因此代理的重要性日益凸显。从目前的状况看,代理还是一种比较神通的文献检索手段。

    可现在代理也不是什么秘密武器,略懂一二者不必说,精通者亦不在少数,估计有数千人,但与前面密码的情况相比还是比较乐观的,而且这部分人的平均素质较高,对密码的依赖程度低,使用时也相对比较合理。基本上每人都有稳定的代理资源,按照规矩办事,很少有“出事”的。如果都是这样的高手,本人的文章就毫无动笔的必要。可问题就在于大量的略懂一二者,其人数可能要十几倍于精通者,得到代理后就急于试探,盲目使用,也导致大量代理关闭或设置密码,总之与密码的情况相似,但代理被察觉的阈值更低,往往较低的通量的异常登陆就会引起注意,敏感性比密码要高得多,一旦关闭再次开放的可能性较低,而且多数人早就将其精简掉,不太会再关注。好在当前代理的数量众多,不过优秀的代理却稀有,一般也不太会公布,即使出现,也不易意识到。用代理搜索工具浪费太大,往往检索到一个优秀的代理可能将大批同样优秀甚至更优秀的代理漏掉,本人倾向于设定基本参数时可以适当放宽,或用多套参数试验,得到一个可以接受的数量,然后人工试探,这样可以避免遗漏。寻找多个优秀代理的目的是备用,有时也为了掩护。至于稳定与否就是“路遥知马力”的问题。

    在使用代理前最好将代理分一下类,有些代理是漏洞,有些是公益,有些是善意,有些是商用,有些是诱饵。不必也不可能完全辨别,只要能辨别出一小部分就足够用。根据你的需要将代理分为外围代理和目标代理。找一些世界各地的稳定的忠实的代理(匿名更好),当需要试验目标代理或密码时使用尽可能接近合法范围的代理,具体方法有好几种,兹不赘述。如果对文献检索进行阶段划分的话,可以分为密码时代、IP时代和后IP时代,三者有前后承接关系,同时也有重叠,现在已经是密码时代末期和IP时代早期,正在进行交接,不知道IP时代可以持续多久,后IP时代又是怎样一种情形。

要让每个人树立“象爱护自己的眼睛一样的爱护代理和密码”的意识是幻想,但尽量少的发布优秀的密码或代理,或者将发布控制在尽可能小的范围内倒是有一定可行性。现在论坛中使用的积分制度是必要的,可分数限制太低,建议可以根据资源的级别来确定限制积分,也反对胡乱限分,同时对积分的获取进行严格的控制,包括对中高级站友。大多数的资源发布者多少是出于一种公益心或善意,但这样的好意只能使资源走向灭绝,对于发布者在行动之前从大局出发考虑一下,今天的行为会给明天带来何等后果。

    同样对于授人以渔的也应当重新考虑,论坛加大这方面的宣传的合理性应该正确审视,发布资源对于提高我国的文献检索水平有一定帮助,对于没有条件得到某些资源但又急需的会员而言无疑是雪中送炭,问题在于这类做法大多数情况下是违背知识产权、违背合法订购原则的,这样的方法永远无法摆到台面上来,至今还没有经过审核公开发行的文献检索书籍是针对于此方面知识的,恐怕永远也不会成为主流,但其确确实实是一种知识,也完全有条件上升为一门学科,一门实用的边缘学科。如何在宣传和控制上达成平衡,应该是目前就需要考虑的问题,不能寄希望于群体素质的提高,而在实质层面上加以管理和规范,既发挥其实用、便利、有益我国的科学事业发展,同时也尽可能遵守规则,减少负面影响,不要弄到人人喊打为止,那时大家都没有路走。现在看到论坛中有些喜人的现象,就是开辟文献检索互助版块,你有需求我来供给,只要管理者有公益心,持之以恒肯定会对目前形式的改观有巨大作用。

    最后回到主题,笔者倡导文献检索实践中应该德才兼备,有忧患意识,同时也心怀感激,切实发挥文献检索的真正用途,合理应用检索技术,作为个人遵守规则,作为管理者加强控制。使文献检索这门潜在的学科走有中国特色的可持续发展道路,成为在当前社会条件下科学研究的有力工具!


查看完整版本: [-- 【转贴】浅谈文献检索中的德才兼备问题 --] [-- top --]



Powered by phpwind v8.7 Code ©2003-2011 phpwind
Gzip enabled