全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
5724 9
2015-10-06
论坛各位高手,现有如下数据:

contest

t

solver

1

1

a

1

2

b

1

3

c

1

4

d

1

5

e

1

6

b

1

7

b

1

8

f

1

9

c

1

10

a

1

11

g

1

12

e

1

13

b

1

14

d

1

15

c

1

16

c

1

17

h

1

18

i

1

19

a

1

20

e

2

1

a

2

2

a

2

3

a

2

4

b

2

5

c

2

6

d

2

7

a

2

8

e

2

9

e

2

10

f

2

11

b

2

12

f

2

13

g

2

14

h

2

15

i

2

16

d

2

17

d

contest表示竞赛场数,solver表示竞赛参赛选手,t表示参赛选手方案提交时间。现欲计算方案提交集中度变量,此变量定义如下:
根据原始数据生成如下数据:
contesttsolverabcdefghin1n2average集中度1集中度2
11a11

1

1

00
12b112

2

1

00
13c1113

3

1

00
14d11114

4

1

00
15e111115

5

1

00
16b121115

6

1.2

0.40.365148
17b131115

7

1.4

0.80.676123
18f1311116

8

1.33333

0.7453560.645497
19c1321116

9

1.5

0.7637630.62361
110a2321116

10

1.66667

0.7453560.57735
111g23211117

11

1.57143

0.7284310.581087
112e23212117

12

1.71429

0.6998540.534522
113b24212117

13

1.85714

0.9897430.726273
114d24222117

14

2

0.925820.654654
115c24322117

15

2.14286

0.9897430.676123
116c24422117

16

2.28571

1.1605770.767649
117h244221118

17

2.125

1.1659220.799816
118i2442211119

18

2

1.1547010.816497
119a3442211119

19

2.11111

1.1967030.823628
120e3442311119

20

2.22222

1.2272620.823273
21a
22a
23a
24b
25c

n1表示参赛选手个数,n2表示方案个数。average表示人均方案数(=n2/n1),其中集中度1计算公式为:
集中度1(contest=1, t=1)=sqrt(((No.a-average)^2)/n1)
集中度1(contest=1, t=2)=sqrt(((No.a-average)^2+(No.b-average)^2)/n1)
集中度1(contest=1, t=3)=sqrt(((No.a-average)^2+(No.b-average)^2+(No.c-average)^2)/n1)
......
集中度2计算公式为:
集中度2(contest=1, t=1)=sqrt(((No.a-average)^2)/n2)
集中度2(contest=1, t=2)=sqrt(((No.a-average)^2+(No.b-average)^2)/n2)
集中度2(contest=1, t=3)=sqrt(((No.a-average)^2+(No.b-average)^2+(No.c-average)^2)/n2)
......

求论坛内各位高手如何计算集中度1和集中度2以便得到如下数据(见下表)。展示的数据中为了便于理解,我预先设置了a-i个solver。但是实际数据中solver的个数众多,事先并不知道solver的具体个数以及其提交方案的次数。
contesttsolver集中度1集中度1
11a00
12b00
13c00
14d00
15e00
16b0.40.36515
17b0.80.67612
18f0.745360.6455
19c0.763760.62361
110a0.745360.57735
111g0.728430.58109
112e0.699850.53452
113b0.989740.72627
114d0.925820.65465
115c0.989740.67612
116c1.160580.76765
117h1.165920.79982
118i1.15470.8165
119a1.19670.82363
120e1.227260.82327
21a
22a
23a
24b
25c

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-10-6 11:03:56
帮你做了一步
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-6 11:04:57
思路也是自己和自己join
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-6 11:32:41
第二部分:
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-6 14:18:21
teqel 发表于 2015-10-6 11:32
第二部分:
十分感谢!
展示的数据中为了便于理解,我预先设置了a-i个solver。但是我的实际数据中solver的个数众多,事先并不知道solver的具体个数,且solver自由提交他们的方案。能否根据数据信息生成相应的solver列表并统计此列表中solver的实时出现次数,以此来计算两个集中度?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-6 19:39:53
自己顶,盼大神出现
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群