1 2        
     
3 4 5
 

聚焦SCI

 
美捷登精彩点评
谷歌学术H5指数及其与汤森路透影响因子对比分析

作者:Mike(美捷登)




每年汤森路透(Thomson Routers)的期刊引用报告(Journal Citation Report, JCR)在中国都引起了高度的关注。原因是在中国科研评价中,科研论文是否发表在被科学引文索引(Science Citation Index, SCI)或科学引文索引扩展版(Science Citation Index Expanded, SCI-E)收录的杂志上,以及该杂志的影响因子的高低都起着举足轻重的作用,甚至成为某些部门和单位唯一的科研评价指标。近年来,依赖汤森路透JCR的科研评价系统受到了质疑、争议、批评和诟病,因而出现了寻求新的科研评价系统的呼声。

谷歌学术(Google Scholar)在2012年推出了一个杂志评价系统,即谷歌学术计量(Google Scholar Metrics),用来评价各个领域杂志的影响力。该系统主要包括H指数(h-index或Hirsch index),H核心(h-core),H中值(h-median),H5指数(h5-index),H5核心(h5-core)和H5中值(h5-median,图1)。

H指数于2005年由美国加利福尼亚大学圣地亚哥分校物理学家乔治·希尔施(Jorge Hirsch)首先提出,原本用来评价某一个学者的影响力,计算基于论文总数及各论文被引用的次数,即某学者如果在其所有学术论文中至少有N篇论文分别被引用了至少N次,那么该学者的H指数就是N。例如,王教授共发表200篇论文,其中有至少50篇被引用至少50次,那么他的H指数就是50。

在谷歌学术计量系统,杂志的H指数指在所有发表的论文中有至少h篇论文分别被引用了至少h次,那么这份杂志的H指数就是h。例如,某杂志共发表5篇论文,分别被引用17,9,6,3和2次,那么这份杂志的H指数就是3;H核心指该杂志最高被引用的h篇论文,如上述杂志的H核心包括被引用17,9和6次的三篇论文;H中值指H核心中位数论文的引用次数,如上述杂志的H中值为9(图1)。

相应地,H5指数,H5核心和H5中值的计算基于收录在谷歌学术系统中的杂志最近5年的论文数量及各论文被引用的次数。例如,如果某杂志在过去5年内所发表的论文中至少有h篇论文分别被引用了至少h次,那么这份杂志的H5指数就是h。H5核心和H5中值依上述方法计算。谷歌学术计量报告虽然公布各杂志的H5指数,H5核心和H5中值,但最重要的还是H5指数。值得一提的是,只有那些在5年内发表了100篇以上论文并且至少有一个引用的杂志才会被收录到谷歌学术中去。


图1. Google学术官网显示的健康与医疗科学刊物的Top20


一、谷歌学术计量报告简介

到目前为止,谷歌已经连续四年发布了杂志学术计量报告。今年(2015年)所发布的报告共包括7211份杂志,由于其中有1761份杂志在不同领域排名中重复出现,因此该报告中实际上只收录了5450份杂志。报告中给出了9种不同语言(英语、中文、葡萄牙语、德语、西班牙语、法语、意大利语、日语、荷兰语)杂志的前100名的信息。另外,该报告对英文类杂志的统计更详细,包括八大领域(商务、经济与管理、化学与材料科学、工程与计算机科学、健康与医学科学、人文、文学与艺术、生命科学和地球科学、物理与数学、社会科学)及261个学科杂志的详细分类排名。每学科只有top20杂志信息,所以没有其余中低档次杂志的排名信息。

谷歌学术指标系统中还提供了搜索功能,输入杂志名称关键词就会给出包含该关键词前20名杂志的排名信息。但是,与汤森路透的JCR数据库不同的是:JCR数据库有往年的报告信息而谷歌学术计量报告没有往年报告信息,所以这两者之间不能进行横向比较。

二、英文杂志Top20分析


Nature(自然)杂志以H5指数377(H5中值为529),排名第一(图2),也就是在2010年到2014年这5年期间,Nature发表的所有论文中引用数不低于377次的共有至少377篇论文;而在今年汤森路透的JCR报告中,Nature以41.456的影响因子(Impact factor)排名第7。

New England Journal of Medicine(新英格兰医学杂志)以H5指数328(H5中值为520),排在第二。这个排名和汤森路透JCR报告的排名一致。

Science(科学)杂志,H5指数为316(H5中值为446),排名是第三位;而该杂志在汤森路透JCR报告中排在第16位。

著名Lancet(柳叶刀)杂志以其258(H5中值为415)的H5指数排在第四位,其排名也和汤森路透JCR报告中排名一致。

Cell(细胞)杂志和Proceedings of the National Academy of Sciences(PNAS,美国国家科学院刊)杂志以216的H5指数并列排在第五位;而它们的H5中值数据不同,分别为330和280。另外,这两个杂志在汤森路透JCR报告中影响因子分别排在第20和186位。

其他进入Top20的杂志H5指数见图1。其中排在第十八位的Nucleic Acids Research杂志在汤森路透JCR报告中排在第213位。有趣的是,排在汤森路透JCR报告中第一名的超牛杂志CA: A Cancer Journal for Clinicians,其影响因子为115.84,而其H5指数为57,没有排进前100名。


图2. Top20杂志


三、H5核心论文发表时间分析

H5指数是对某杂志过去5年期间所发表的论文引用数进行的评价,例如,2015年对2010~2014期间所发表对论文引用数进行的评价。笔者根据汤森路透JCR报告中的影响因子,选择了五份高中低档次发杂志,对H5核心论文发表时间进行力分析。这五份杂志分别为Nature,CA: A Cancer Journal for Clinicians,Cancer Research,PLoS ONE和Cutis,他们的H5指数分别为377、57、138、161、16(图3)。

Nature:对Nature杂志的这377篇论文发表时间分析发现,其中2010年有163篇(43.24%),2011年有128篇(33.95%),2012年有76篇(20.16%),而2013和2014年各有9篇(2.39%)和1篇(0.27%)(图3A)。也就是说,该杂志H5指数的377篇论文主要是来自于2010~2012这三年(97.34%);2013和2014年的论文比例仅为2.66%。

CA: A Cancer Journal for Clinicians:对影响因子排名第一的综述性牛刊CA: A Cancer Journal for Clinicians的57篇论文发表时间分析发现,其中2010年有16篇(28.07%),2011年有17篇(29.82%),2012年有12篇(21.05%),2013年有7篇(12.28%),以及2014年有5篇(8.77%)(图3B),综述性牛刊的57篇论文在2010~2012三年的占78.95%,而后两年2013和2014年的论文所占比例“高达”20%之多(相较其他四份杂志而言)。

Cancer Research:对Cancer Research杂志的138篇论文分析发现,2010年有77篇(55.80%),2011年有41篇(29.71%),2012年有14篇(10.14%),而2013和2014年各有5篇(3.62%)和1篇(0.72%)(图3C)。从中看出,前三年论文数占95.65%,2013和2014两年仅为4.35%。

PLoS ONE:PLoS ONE杂志的161篇论文,其中2010年有91篇(56.52%),2011年有45篇(27.95%),2012年有21篇(13.04%),而2013和2014年各有3篇(1.86%)和1篇 (0.62%)(图3D);前三年论文数占97.52%,而2013和2014两年仅为2.48%。

Cutis:Cutis杂志的16篇论文,其中2010年有10篇(62.5%),2011年有5篇(31.25%),2012年有1篇(6.25%)(图3E)。从中看出前三年论文数占100%,而2013和2014两年没有论文进入H5考量范围。

|

图3. Nature, CA: A Cancer Journal for Clinicians, Cancer Research, PLoS ONE和Cutis杂志H5核心论文发表时间分析

分析如上数据发现,这五份杂志H5指数论文中,前三年(2010~2012)发表的论文所占比例78.95%~100%。除了综述性牛刊后两年占20%以上外,其余杂志学术指标中后两年的论文都在5%以下。也就是说,虽然谷歌学术计量报告声称H5指数是对杂志过去五年发表论文的引用数进行评估分析,但实际上只是对杂志前三年所发表论文的引用情况进行评估,因此可以说是对一个杂志的持久影响力进行评估。然而,汤森路透JCR报告是对杂志2012和2013年所发表的所有论文在2014一年中的总引用数进行统计分析,是对一个杂志的当前影响力进行评估。所以,只有同时使用这两种评价系统来对杂志进行综合评估才算相对全面和客观。

四、谷歌学术H5指数和汤森路透影

响因子的关系

笔者对120个杂志的谷歌学术H5指数和汤森路透影响因子进行分析后发现两者具有一定相关性,尤其是低影响因子范围的杂志(图4)。


图4. 影响谷歌学术H5指标和汤森路透影响因子平衡的两大因素

但这个相关性对个别杂志不适用,例如:个别杂志的影响因子很高,而H5指数相对偏低;有的杂志则相反,H5指数很高但影响因子却相对偏低;也有些杂志虽然影响因子不同,但是有相同的或相近的H5指数,比如Nano Research和CA: A Cancer Journal for Clinicians的H5指数都为57,而它们的影响因子分别为7.01和115.84,相差甚远。这是由于在过去的五年内,Nano Research发表的论文总量为500多篇,是CA: A Cancer Journal for Clinicians杂志论文发表总量的5倍,也难怪如此低影响因子的杂志会和CA: A Cancer Journal for Clinicians有相同的H5指数,即Nano Research的500篇论文中有57篇论文的单篇引用数超过57次,而CA: A Cancer Journal for Clinicians的100篇论文中也有57篇论文的单篇引用数超过57次;就算CA: A Cancer Journal for Clinicians的全部(100篇左右)论文的单篇引用数都超过100,那它的H5指数也就才100,挤进H5指数排名的Top100都有困难。

同样,PLoS ONE的H5指数为161,即在该杂志近五年内发表的10.6万多篇(106936)论文中,有161篇(占总发表量的0.15%)的单篇引用数超过161次。H5指数似乎更强调“大网捞鱼”,论文发表数量多的杂志很占优势。笔者从汤森路透官网收集了Top20杂志的2010~2013四年的论文发表总量,如图2数据显示:Top20杂志多数既有较高的“论文发表总量”,同时也有较高的“单篇论文引用数”;这两者犹如天平的两端,像CA: A Cancer Journal for Clinicians这样的牛杂志,由于总论文发表量低,导致其H5指数偏低。

也有少数杂志是影响因子很高,H5指数也很高,比如新英格兰医学杂志(图4红框内最上面的杂志),前提是该杂志论文发表数量要足够多。谷歌学术H5指数前100名杂志的汤森路透JCR排名和影响因子见附表。

五、谷歌学术H5指数的优缺点

优点
1.汤森路透集团JCR报告需要购买账号查询,而谷歌学术H5指数查询是免费的。
2.H5指数对9种不同语言的出版物前一百名进行评估分析,因此有广泛代表性。
3.H5指数不受有超高引用单篇论文的影响,相对比较客观。
4.谷歌学术数据库收入范围非常广泛,不仅包括学术期刊,而且还收录书籍、会议、以及各种预印本。
缺点
1.主要评估杂志近五年内,头三年所发表论文的引用情况。
2.偏重年发表论文量大的杂志。
3.由于不能查看谷歌的H5指数往年数据,所以不能进行年度横向对比(除非有心人每年都存下当年数据)。
4.谷歌学术指标数据库只提供了英文杂志各领域前20名杂志信息,其余中低档次杂志信息未知。
5.谷歌没有提供对各领域及学科分类的标准,也没有提供每个杂志所隶属的学科信息。

综上所述,谷歌学术指标具有一定的代表性和指导意义,但由于谷歌的学术指标才发布了四年,有些问题仍有待完善,比如杂志数据库收录的各项指标等,一旦修改就会影响全部数据。
在多年的科研生涯中,笔者写作并投稿了不少SCI期刊,在这一过程中也和编辑、审稿人有过多次互动,自己也得到被不少SCI期刊邀请作审稿人的机会。这里以自己投稿几篇高水平的研究论文和综述的亲身经历来总结下如何写好SCI论文、如何提高选投SCI期刊命中率和如何应对审稿人意见等方面的技巧。





 

 

主编 夏华向
执行主编 张媛媛
编辑部主任 段柳
本刊编辑 李玉冰 王可苗 李汝琴
主办 医学研究与发表编辑部
赞助 美捷登生物科技有限公司
出版 华誉出版社有限公司
网址 www.mrpcenter.com
电子信箱 sub.mrpexpress@gmail.com
数字制作 11m数字出版 asia11m@qq.com

1
1 2