第1章 方法论和数据说明
1.1 背景介绍
科学研究的世界呈现蔓延生长、不断演化的景象。科研管理者和政策制定者需要掌握科研的进展和动态,以有限的资源来支持和促进科学进步。对于他们而言,洞察科研动向,尤其是跟踪新兴专业领域,对其工作具有重大的意义。
为此,科睿唯安发布了“研究前沿”(Research Fronts)数据和报告。定义一个被称作研究前沿的专业领域的方法,源自科学研究之间存在的某种特定的共性。这种共性可能来自实验数据,也可能来自研究方法或者概念和假设,并反映在科学家在论文中引用其他科学家的工作这个学术行为之中。
通过持续跟踪全球*重要的科研和学术论文,研究分析论文被引用的模式和聚类,特别是成簇的高被引论文频繁地共同被引用的情况,可以发现研究前沿。当一簇高被引论文共同被引用的情形达到一定的活跃度和连贯性时,就形成一个研究前沿,而这一簇高被引论文便是组成该研究前沿的“核心论文”。研究前沿的分析数据揭示了不同研究者在探究相关的科学问题时会产生一定的关联,尽管这些研究人员的背景不同或来自不同的学科领域。
总之,研究前沿的分析提供了一个独*的视角来揭示科学研究的脉络。研究前沿的分析不依赖对文献的人工标引和分类(因为这种方法可能会有标引分类人员判断的主观性),而是基于研究人员的相互引用而形成的知识之间和人之间的联络。这些研究前沿的数据连续记载了分散的研究领域的发生、汇聚、发展(或者是萎缩、消散),以及分化和自组织成更近的研究活动节点。在演进的过程中,每组核心论文的基本情况,如主要的论文、作者、研究机构等,都可以被查明和跟踪。通过对该研究前沿的施引论文的分析,可以发现该领域的*新进展和发展方向。
2013年,科睿唯安发布了《2013研究前沿——自然科学与社会科学的前100个探索领域》的白皮书。2014年和2015年科睿唯安与中国科学院文献情报中心成立的“新兴技术未来分析联合研究中心”推出了《2014研究前沿》和《2015研究前沿》分析报告。2016年、2017年、2018年和2019年,中国科学院科技战略咨询研究院、中国科学院文献情报中心和科睿唯安联合发布了《2016研究前沿》《2017研究前沿》《2018研究前沿》和《2019研究前沿》分析报告。这一系列报告引起了全球广泛的关注。2020年,在以往系列研究前沿报告的基础上,推出了《2020研究前沿》分析报告。报告仍然以文献计量学中的共被引分析方法为基础,基于科睿唯安的Essential Science Indicators(ESI)数据库中的11 626个研究前沿,遴选出了2020年自然科学和社会科学的十一大学科领域排名*前的110个热点前沿和38个新兴前沿。
1.2 方法论
整个分析工作分为两个部分:研究前沿的遴选、148个研究前沿的核心论文及其施引论文的数据提供由科睿唯安负责完成;研究前沿的分析和重点研究前沿(包括重点热点前沿和重点新兴前沿)的遴选及解读由中国科学院科技战略咨询研究院科技战略情报研究所主持完成。此次分析基于2014~2019年的论文数据,数据下载时间为2020年3月。
1.2.1 研究前沿的遴选
《2020研究前沿》分析报告反映了当前自然科学与社会科学的十一大学科领域的148个研究前沿(包括110个热点前沿和38个新兴前沿)。我们以ESI数据库中的11 626个研究前沿为起点,遴选目标是要找到那些较为活跃或发展迅速的研究前沿。报告中所列的148个研究前沿的具体遴选过程如下。
1.2.1.1 热点前沿的遴选
首先把ESI数据库的21个学科划分到11a个高度聚合的大学科领域中,然后对每个ESI学科中的研究前沿的核心论文,按照总被引频次进行排序,提取排在每个ESI学科前10%的*具引文影响力的研究前沿,并将其整合到十一大领域中,以此数据为基础,再根据核心论文出版年的平均值重新排序,遴选出每个领域中那些“*年轻”的研究前沿。通过上述几个步骤在每个大学科领域分别选出10个热点前沿,共计110个热点前沿。因为每个领域具有不同的特点和引用行为,有些学科领域中的很多研究前沿在核心论文数和总被引频次上会相对较小,所以从十一大学科领域中分别遴选出的排名前10的热点前沿,代表各大领域中*具影响力的研究前沿,但并不一定代表跨数据库(所有学科)中*大*热的研究前沿。
1.2.1.2.新兴前沿的遴选
一个有很多新近的核心论文的研究前沿,通常提示其是一个快速发展的专业研究方向。为了选取新兴的前沿,组成研究前沿的基础文献(即核心论文)的时效性是优先考虑的因素。这就是我们称其为“新兴前沿”的原因。为了识别新兴前沿,我们对研究前沿中的核心论文的出版年赋予了更多的权重或优先权,只有核心论文平均出版年在2018年6月之后的研究前沿才被考虑,将每个ESI学科的研究前沿按被引频次从高到低排序,选取被引频次排在前10%的研究前沿,然后各学科战略情报研究人员经过调研和评审,遴选出每个ESI学科中的新兴前沿,并将其整合到十一大领域中,从而遴选出了十一大领域的38个新兴前沿,这38个新兴前沿*早的平均出版年是2018.6。遴选不限定学科,因此38个新兴前沿在十一大学科领域中分布并不均匀,例如,数学领域和信息科学领域没有新兴前沿入选,生态与环境科学、地球科学、天文学与天体物理学等领域分别只有1个新兴前沿,而化学与材料科学领域则选出了6个新兴前沿。
通过以上两种方法,本报告突出显示了11个高度聚合的大学科领域中的110个热点前沿和38个新兴前沿。
1.2.2 研究前沿的分析及重点研究前沿的遴选和解读
本报告在科睿唯安遴选的148个研究前沿数据的基础上,由中国科学院科技战略咨询研究院的战略情报研究人员对十一大学科领域的110个热点前沿的发展趋势进行了分析,并对31个重点研究前沿进行了详细的解读(见第2~12章)。重点研究前沿包括重点热点前沿和重点新兴前沿两部分。
研究前沿由一组高被引的核心论文和一组共同引用核心论文的施引论文组成。核心论文来自ESI数据库中的高被引论文,即在同学科同年度中根据被引频次排在前1%的论文。这些有影响力的核心论文的作者、机构、国家在该领域也做出了不可磨灭的贡献,本报告也对其进行了深入分析和解读。同时,引用这些核心论文的施引论文可以反映出核心论文所提出的技术、数据、理论在发表之后是如何被进一步发展的,即使这些引用核心论文的施引论文本身并不是高被引论文。
1.2.2.1 重点研究前沿的遴选
2014年研究前沿设计了遴选重点研究前沿的指标CPT,2015年在CPT指标的基础上,又增加了规模指标,即核心论文数(P)。
1)核心论文数
ESI数据库用共被引文献簇(核心论文)来表征研究前沿,并根据文献簇的元数据及其统计揭示研究前沿的发展态势,其中P总量标志着研究前沿的大小,文献簇的平均出版年和论文的时间分布标志着研究前沿的进度。P值表达了研究前沿中知识基础的重要程度。在一定时间段内,一个前沿的P值越大,表明该前沿越活跃。
2)CPT指标
CPT,是核心论文的总被引频次(C)除以P,再除以施引论文所发生的年数(T)。“施引论文所发生的年数”指施引论文集合中*新发表的施引论文与*早发表的施引论文的发表时间的差值。如*新发表的施引论文的发表时间为2019年,*早发表的施引论文的发表时间为2015年,则该施引论文所发生的年数为4。
CPT实际上是一个研究前沿的平均引文影响力和施引论文发生年数的比值。该指标越高,代表该前沿越热或越具有影响力。它反映了某研究前沿的引文影响力的广泛性和及时性,可以用于探测研究前沿的突现、发展及预测研究前沿下一个时期可能的发展。该指标既考虑了某研究前沿受到关注的程度,即核心论文的总被引频次,又反映了该研究前沿受关注的年代趋势,即施引论文所发生的年度。
在研究前沿被持续引用的前提下,当两个研究前沿的P值和T值分别相等时,则C值较大的研究前沿的CPT值也随之较大,指示该研究前沿引文影响力较大。
当两个研究前沿的C值和P值分别相等时,则T值较小的研究前沿的CPT值会较大,指示该研究前沿在短期内受关注度较高。
当两个研究前沿的C值和T值分别相等时,则P值较小的研究前沿的CPT反而会较大,指示该研究前沿中核心论文的平均引文影响力较大。
《2020研究前沿》在遴选重点研究前沿过程中,对每个大学科领域的10个热点前沿用P和CPT指标结合战略情报研究人员的专业判断各遴选出一个重点热点前沿,专业判断主要考虑该前沿是否对解决重大问题有重要意义。首先选择P值*大的前沿,如果P值*大的前沿已经在往年的研究前沿中解读过,就选择P值次大的前沿进行解读。然后,用CPT指标结合专业判断再各遴选出一个重点热点前沿。因此,通过这两种方法共遴选出22个重点热点前沿。对于38个新兴前沿,利用CPT指标结合战略情报研究人员的判断遴选出9个重点新兴前沿。因此对于148个研究前沿,共遴选出31个重点前沿进行深入解读。
1.2.2.2 研究前沿的分析和解读
1)热点前沿分析及重点热点前沿的解读
对于每个学科领域,第一张表展示各自的前10个热点前沿的核心论文的数量、被引频次及核心论文平均出版年,每个学科领域遴选出的重点热点前沿在表中用绿色底纹标出。然后,对每个学科领域遴选出的重点热点前沿进行深入分析和解读。因为分析数据基于2014~2019年发表的论文,所以核心论文平均出版年份会介于2014~2019年。
每个领域的10个研究前沿中引用核心论文的论文(施引论文)的年度分布用气泡图的方式展示。基于P值遴选的重点热点前沿用蓝色气泡表示,基于CPT指标遴选的重点热点前沿用红色气泡表示。气泡大小表示每年施引论文的数量,对于那些施引论文量大而施引论文所发生的年数少的前沿,也就是CPT值的前两种情况,可以从图中直观地看出哪些是重点热点前沿。但是对于P值较小的情况,则需要结合数据来看。大部分研究前沿的施引论文每年均有一定程度的增长,因此气泡图也有助于对研究前沿发展态势的理解。
每个学科领域的第二张表对核心论文的国家、机构活跃状况进行了分析,揭示出哪些国家、机构在某重点热点前沿中有较大贡献。第三张表则对施引论文中的国家和机构进行了分析,探讨机构、国家在这些研究前沿的发展中的研究布局。
2)新兴前沿分析及重点新兴前沿的解读
新兴前沿的体量(核心论文及其施引论文)较小,统计数据的分析意义不大。因此,只由战略情报研究人员对重点新兴前沿的核心论文及相关信息进行内容方面的解读,借此可以了解重点新兴前沿的发展脉络、研究力量布局及发展前景。
展开