黃河泉 发表于 2020-7-4 08:37 
几年前,我应邀淡大产经系去演讲,讲题即与交互项有关,之后,我将讲稿置放于论坛上 (https://bbs.pinggu.o ...
老师您好,抱歉在帖子下回复无关内容,(因为主贴回复没有显示)。
学生想请教一下如何用stata计算G指数。
G指数的计算方法为:将发表的论文按被引次数由高向低排序,将序号平方,被引次数按序号层层累加,当序号平方大于等于累计被引次数时,该序号则为g指数。如序号平方不是恰好等于而是小于对应的累计被引次数,则最接近累计被引次数的序号即为g指数。简而言之,g 指数是引频累积数量大于等于序号平方的最大序号。
举个例子:
某个学者发表了10篇论文,具体引用次数如下:
论文序号n 1 2 3 4 5 6 7 8
被引频次times 30 8 6 5 5 4 3 2
累计被引频次sum_times 30 38 44 49 54 58 61 63
序号平方n2 1 4 9 16 25 36 49 64
表1的第3行和第4行分别计算了该学者的累积被引频次和论文序号的平方。通过将二者依次对比可以发现,当论文序号为7时,该作者的累积被引频次61大于论文序号的平方49;但当论文序号为8时,该作者的累积被引频次63开始小于序号的平方64,所以该学者的g指数为7。
author代表作者,year代表年份,times代表被引频次,sumtimes代表累计被引频次,n2代表序号平方。
从大于等于0的至少有0个循环起,另外生成一个新列或新的数据集,对应author,year,G。
修正数据如下,还望老师百忙之余可以指点一二,学生不胜感激。
----------------------- copy starting from the next line -----------------------
------------------ copy up to and including the previous line ------------------