《引文索引的理论与应用》(节载之二) (美)加费尔德著 侯汉清译)
发布时间:2018-09-27  浏览次数:480

引文索引的理论与应用(节载之二)

(美)尤金·加费尔德著  侯汉清译  刘煜审校

第十章  有关科学家的引文分析(续)

 

优势与缺陷

      任何把引文分析作为评价科学家工具的公正评价都必须承认,我们对于被引频次的含义尚有很多地方未弄清楚。我们仍然不能精确地知道它们评价的科研绩效的质量。我们对影响被引频次的社会学因素知之甚少。有关低被引频次的成因,亦知之甚少。对于不同领域的引文模式的变化,仍有很多东西值得学习,这是一个方面。

     另一个方面,我们知道被引频次表明了某人的科研工作所做出的贡献,至少在科学界的同仁们发现其中的功效和兴趣方面。我们现在知道,高被引频次与同行专家对科研贡献的先进性和重要性的评议相关。而且我们现在已经弄清总的引文模式以及影响它们的变量,打算设计一种有用的统计模型去预测一个科学家毕生的被引频次(按照科学家的每篇论文的平均被引频次计算)。

      这种模型已经由N.L.Geller、J.S.deCani及R.E.Davies研制和试验。它是基于我们对总的引文模式和科技文献的年度增长情况的了解。输入此模型的是科学家个人现有论文(至少4年)的被引用历史。以这些为出发点,此模型推算出40年期间(一般认为,一篇论文的寿命为40年)每篇论文的总的被引频次。每篇论文的终生平均被引频次可以从40年的被引总频次中计算出来。该模型还开发出一种确认技术,去识别那些值得人们特别注意的论文,因为这些论文的被引用历史表明其引文模式显然不同于一般论文。

       这样一种模型的开发是走向系统利用引文统计、减少方法性错误的影响的重要一步。但是,我们仍需谨慎从事,仍需弄清引文统计作为相对的科研绩效评测的局限性。就像使用任何方法一样,引文分析结果的有效性与运用引文分析的技巧是高度密切相关的。引文计数的简明性掩蔽了与引文统计相关的不少敏感性问题。忽略这些敏感性问题的肤浅的引文研究,往往会严重误导别人。正确的引文研究要求充分了解进行被引频次比较时的各种错综复杂的情况,处理那些被引频次不特别高的情况时,尤其应当如此。

  前面已经论述了支持和反对把被引频次作为评价工具的种种理由。对于这场争论,其中有两个事实是基本的。其一,当科研机构变得越来越大,它们在社会上的作用越来越重要时,确认机构中做出最大贡献的人员和小组的评价工作,就变得越加困难、越加昂贵和越加必要。其二,引文测度被证明是一种同行专家评议的有效方式,它把一些有用的、客观的因素引入到评价过程中,而且只涉及到少量的使用调查技术的费用。而引文分析与凭直觉判断相比,有时花费的时间和工夫,则显然要多得多。但是专业的评价肯定是十分重要的,足以表明这种投入是正确的。

结束语:引文索引法的未来

  本书的主要内容是引文索引法的过去和现在。引文索引法的未来将会如何呢?

引文索引法预示着它的未来将像现在这样的强劲发展。引文索引作为一种进行科技文献回溯检索的工具将会继续普及,而且可能会加速普及。

  引文索引法的加速普及将取决于如下几个因素:

联机检索在全球的普及,将会使SCI检索系统为大多数科学家和学者所掌握。联机检索软件的改进,将会使熟悉SCI的人们增加对该检索系统的利用。

  不断增加的、对引文索引用作研究评价工作一个组成部分的了解,将会引导更多的科学家去学会使用SCI。优秀的“裁判”终将有希望阻止那些貌似公允合法、实为折衷的做法。

  检索SCI、SSCI等数据库将会变得越来越方便。微存储技术或微型计算机最终将使得科学家个人或科研机构、小组拥有自己的此类数据库,变得在经济上是可行的。同时,联机检索及对存储在中央计算机中的数据库的远程联接成本的不断降低,将会增加检索的便利性。 

另外,ISI正在认真考虑生产基于某一学科期刊文献的专业引文索引的想法。但是,被引文献和引用文献将会反映出这一学科领域范围的广泛性及分散性。这种专业引文索引将收录该学科著者的全部引文以及非该学科的著者指向该学科的引文。

要编制专业引文索引,亟待解决的关键问题仍然是在设计《遗传学引文索引》(见第二章)时所面临的问题,即如何去定义文献,才能使不相关的文献压缩到最低限度,但是又不致于损害引文索引反映学科与学科之间的交互作用的能力。一种方法是《遗传学引文索引》实验项目中曾经试用过的,即在适合某些学科标准的多学科的SCI、SSCI数据库中定义被引著者的子集,然后再由著者的子集出发去定义来源文献(见第二章)。另一种方法是近几年在期刊引用研究中采用的,即先利用《期刊引用报告》去识别该学科的来源期刊,然后再直接编制这些来源期刊所发表的各种论文和资料的引文索引。用上述两种方法编制的专业引文索引,无论在价格上或在规模上,都适合科研机构图书馆或私立图书馆的要求。

  这种专业引文索引将是长期累积的。例如,有一种累积长达20年的地球SCI目前正在评估之中。虽然有些领域比较依赖于较早的文献而不是新的文献,但是大规模的多年度累积将展示某一学科的重要的历史回顾,这是用其他方法难以企及的。这正是为什么我要把ISI回溯SCI的目标确定在20世纪的前60年的原因。

利用引文索引进行文献检索不仅将在科学技术界加速普及,而且也将在艺术及人文科学界传播开来。艺术及人文科学界的学者也开始广泛地利用A&HCI。

  用引文统计数据进行评价工作、并用于历史研究和社会学研究,将会迅速传播开来。尽管有关引文统计数据在这些方面的应用尚有一些争议(见第10章),但是,它已经成为一种探寻科学的社会体系的标准工具。目前,有关引文研究的文献正在迅速增长。至少每年发表100篇论文,其中大多数独立于《Current Contents》及其他刊物发表的各种ISI研究成果之外。

S.Cole、L.Rubin和J.R.Cole一起研究美国国家科学基金会拨款依据的评估方法时,引文统计数据是研究确定是否提出拨款建议的参数之一。这一参数被采纳的事实表明引文统计数据已经被逐渐接受为研究工作价值的一种法定指示物。有时发现引文统计数据与实际上的项目拨款没有明显的关联,这种情况表明,滥用引文统计数据的可能性并不会等同于事实上对引文统计数据的滥用。我希望这种情况在将来不会改变。

  ISI正在竭力使引文统计数据变得尽量准确。关于第一著者的引文统计数据和全部著者引文统计数据之间的首次全面比较的最新出版物,是朝着这个方向迈出的重要一步。这次比较的数据不仅表明必须仔细谨慎的编辑被引频次,而且也显示出在使用被引频次方面的一些细微但重要的差别。拿合著者的比例居高不下这件事来分析。一名科技行政管理人员与研究人员出现多篇合著论文,如果合著的比例过高,人们就会对这位科技行政管理人员的著述伦理提出疑问。如果一名教师与多名研究生合著论文,合著的比例很高,反而表明这位教师的影响力。这两种情况在引文统计数据中都可以看到。

几项关键性的进展预示着在社会学研究中引文统计数据应用的重大扩展。其中一项是美国国家科学基金会拨款给ISI,为20世纪20年代物理学期刊文献编制一部引文索引。这个引文索引数据库将用来测度引文分析是否能够对被称为“现代物理学黄金时代”的那个10年的活动,提供一些新的、有益于社会学研究的看法。此项研究要求根据这个数据库最终完成引文网络和同引聚类图,据此历史学家和社会学家可以进行研究。

  对于学术界来说,具有更大意义的一件事情是近年来ISI与美国科学基金会之间签署的协议。这个协议允许受美国国家科学基金会资助的学者利用SCI数据库的全部数据进行项目计划、科学方针研究等工作。我希望与大多数国家签署类似的协议。日本文部省已经租用ISI数据库,我希望在不久的将来苏联也会这样做。近几年意大利国家研究理事会一直在利用SCI文档进行信息的获取和处理。

  引文索引扩大应用范围的第三项重大进展是A&HCI的问世。生产艺术和人文科学文献的引文索引的想法至少可以回溯到1955年。1955年11月我向美国文献工作学会年会提交了一篇论文,大致阐述了编制《圣经》引文索引的想法,这个索引将有益于研究科学与人文科学之间的互相影响。A&HCI将促进和刺激对上述关系的新的研究。

  第四项进展是预期会增加引文分析对社会学影响的普赖斯有关累积优势过程的理论。所谓累积优势理论是一种在成功孕育着成功的情况下起作用的理论。默顿及随后的S.Cole和J.R.Cole曾经描述过在科学的社会体系中起作用的这种过程。普赖斯关于这种过程的理论提出了一种预示这种过程分布的统计模式。其重要意义在于这种统计模式所预示的分布情况与下列几种经验定律所得出的分布情况相一致,这些定律包括:科学生产能力的洛特卡分布定律、期刊利用的布拉德福定律、收入分布的帕莱托(Pareto)定律以及文献词频的齐夫定律。普赖斯所说的“累积优势分布”也适合于引文-频次分析的经验性的结果。似乎可以说,普赖斯的理论提供了一种统一的概念框架,可以用于各种经验定律和支撑文献计量学研究的引文统计数据分析。

  这种理论对文献计量学领域和对该领域内引文统计数据的利用,产生了一种重要的影响。首先在试图确定引文统计数据和其他文献计量学的测度表示了什么方面,它似乎是迈出了重要的一步。它也将提供一种概念基础,用以增加从现已存在的引文统计数据的丰富蕴藏中得出有用的经验概括和基础理论的概率。虽然现在预言这种进展的结果是不可能的,但是我们有理由去推测他们可能对科学的实践产生一种非常重要的影响。

  只要科学家和学者继续使用被称之为“论文”的工具作为主要的交流介质,引文索引法和引文分析将会在人类知识管理和知识生产的过程中,发挥越来越显著的作用。学术论文的未来似乎常常处于危难之中。一代学者面临的技术变革是否会破坏论文在学术中的作用,人们将拭目以待。我与生俱来的乐观主义使我希望这种情况将不会出现,引文索引法将会对学术研究产生越来越强大的积极影响。

尤金·加菲尔德传略

  尤金·加菲尔德(Eugene Garfield)是美国著名的情报学家,美国科技信息研究所(Institute of Scientific Information,旧译科学情报社)及《科学引文索引》的创始人。

  加菲尔德于1925年9月6日出生在纽约市区,在一个犹太—意大利人的家庭中长大。他好读书,从小就爱读杂志上的目录,每天去纽约市公共图书馆度过大部分时间,在那里翻阅各类书籍。中学毕业后,当过电焊工人、建筑工人。二战爆发后他毅然参军,当过滑雪兵。战后复员享受政府的优惠,入哥伦比亚大学学习化学,1949年获得科学学士学位。1954年他又获得哥伦比亚大学图书馆学硕士学位。1961年他还在宾西法尼亚大学获得了结构语言学的博士学位。他撰写了一篇关于语言学在化学情报标引中应用的博士论文,并于1961年10月在《自然》杂志上发表,题为:《化学语言学:化合物名称的计算机翻译》。

  1951年,麻省理工学院Jim Perry教授原来计划雇用加菲尔德参加一项有关情报检索的项目,后来因计划变动便改去参加霍布金斯大学韦尔奇医学标引研究项目。他作为一位化学家参加了《医学主题词表》的编制和修订工作。这个项目是美国武装部队医学图书馆(后来的国家医学图书馆)提出的,主要是研究机器在生产和编制医学文献索引中可能起到的作用。在研究中,他逐渐对能否用机器自动提取标引词产生了兴趣。他发现从文献篇名或文摘中抽取关键词对于文献核心内容的标引有一定的作用。但是这样做不能识别文献主题之间的关系,而且“是以失去对索引有着十分重要作用的选择性为代价的”。因此他决定另辟蹊径,从抽词标引转向引文标引。

  早在哥伦比亚大学化学系读书时,加菲尔德就为《化学文摘》做过义务文摘工作,对论文及综述后所附的参考文献十分感兴趣。他渐渐地形成了引文也许是新型检索方法突破口的想法。在1953年召开的一次科技文献机器管理的研讨会上,他透露了这个想法,没有引起与会情报工作者的注意。但是,已经退休在家的谢泼德引文出版公司的副经理威廉·阿德尔(Millian C. Adair)碰巧看到了会议的简报,就给加菲尔德写信,建议加菲尔德参考一下他们公司出版的《谢泼德引文》(Shepard’s Citation)。他迅即在一家图书馆找到了这种工具书,看后大受启发。这种80年前出版的法律工具书把他的一些模糊的想法勾勒出一幅清晰的图画。加菲尔德后来在回忆中写到:“在我的事业中,这是一个决定性时刻”。

  1954年加菲尔德从哥伦比亚大学毕业前,在英国著名的《文献工作杂志》(Journal of Documentation)上发表了他的处女作——《用自动穿孔卡技术编制标题表》。后来被美国图书馆学家谢拉(J.H.Shera)指定为《美国文献工作》杂志的副主编。此后他与谢拉等人合作,开始小规模的实验,先后试编了一些引文索引。1955年,他在美国《科学》杂志上发表《引文索引用于科学》的重要论文,系统地提出了用引文索引检索科技文献的新方法,从而打破了分类法和主题法在检索方法中的垄断地位,打开了从引文角度来研究文献及科学发展动态的新领域。

  加菲尔德为了使引文检索法变成现实,在实践中赢得图书馆、情报界和科学界的承认,1960年创办了科技情报企业——科技信息研究所,并争取政府的资助,进行引文的可行性实验。1961年他通过J.Lederberg博士,取得了美国国家科学基金会的资助,编成了第一部有关遗传学文献的引文索引,探索多学科或边缘学科引文索引的可行性。该索引得到了科学工作者的好评。1963年他编制、出版了《科学引文索引》单卷本。1964年科技信息研究所开始正式出版发行《科学引文索引》(季刊)。1973年又继而出版了《社会科学引文索引》(SSCI),1978年又出版了《艺术和人文科学引文索引》(A&HCI)。这样,引文索引这项富有创意的发明在图书馆及情报界牢固地确立了自己的地位。

  早在1955年加菲尔德发表《引文索引用于科学》一文的时候,就预见到引文索引可以用于评价期刊。此后他和美国著名的科学史专家普拉斯(D.T.Price)在引文索引的基础上发展了引文分析的技术。引文分析现在已奇迹般地成为评价国家科学能力,科学团体和科学家个人的学术水平和影响力,评价核心期刊、核心出版社,分析预测科学进展的动向和趋势等方面的重要方法和工具。加菲尔德研制的引文索引不仅开创了一种新的检索途径,增加了一种新的检索工具,而且为文献计量学、科学计量学、科学学等学科的发展开辟了道路。

  加菲尔德有着不断创新、积极进取的精神,除引文索引以外,还编制、出版了《近期目次》,为研究工作者查阅最近出版的期刊论文提供了一种重要的检索刊物。《近期目次》的研制经历了一个相当曲折的过程。最初他受医学标引的启发,决定开发Current Contents of Management and Social Science。开始时贝尔实验室曾经是他的大客户,订购了500份。后来他克服了经费上的重重困难,并将刊名由Management’s Documentation Preview改名为Current Contents,覆盖了七大学科领域。他还在《近期目次》的基础上开发了一种个性化的定题服务——自动学科文献通报,现在称为Research Alert。

  70年代末,科技信息研究所已经成为一家别具一格、颇有影响的科学兼商业机构。它在九个国家设立了办事处,总共编辑发行了25种出版物,其中除了SCI、SSCI、A&HCI三大引文索引刊物以外,还包括《科学技术会议录索引》(ISTP)、《科学评论索引》(ISR)等著名期刊,并以磁带、软盘、联机和光盘等介质予以发行。

  80年代后期加菲尔德认为,超文本、跨学科的引文索引最适合于在网络环境中运行,因而十分重视这些刊物由光盘版向网络版的发展。他亲自参与了Web of Science的早期开发。现在ISI隶属于汤姆逊公司(The Thomson Corporation)集团,总部仍设在费城,并在世界各地设有办事处。近年来ISI推出了新一代学术信息资源的整合体系——ISI Web of Knowledge。它将高质量的数字信息资源(包括上述著名刊物、CC、CA、BA、Derwent专利等文献数据库)、信息评价工具(包括(ISI Essential Science Indicators,即基本学科高影响论文数据库和ISI Journal Citation Reports,即期刊引用报告数据库)以及书目管理软件(如EndNote, ProCite, Reference Manager)三者无缝连接,形成统一的界面,进行跨库、跨平台的检索,提取、管理、分析和评价服务,深获全球学术界的信赖和支持。

  加菲尔德不仅是一位成功的企业家和改革家,而且是一位勤奋的教师和学者。从1974年以来,他在美国宾西法尼亚大学及其他多所大学担任兼职教授,并经常应邀去世界各国讲学。1986年还创办了《科学家》(The Scientist),并担任这份报纸的主编。在长达25年的时间内,他几乎每周为《近期目次》撰写一篇论文。早在70年代他就出版了他的代表作——《引文索引法的理论及其在科学、技术和人文科学中的应用》。1980年又出版了四卷本的个人文集《一个情报学家的札记》,收录了他20多年来撰写的1000余篇文章。他著作等身,年近八旬,但是每天仍在辛勤耕耘,仍在不断地发表有关情报学、科学学、文献计量学、科学计量学等学科的论文。1998年由于他40多年来为情报学做出的巨大贡献,当选为美国情报学会(ASIS)主席。加菲尔德作为一位活跃的学者、作家和革新者,仍在为情报学的发展继续奋斗着。