全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
6295 4
2010-08-23
小弟菜鸟,为了做一个research在硬着头皮学SAS,看了不少书发现也不管用(根本不够用阿。。。)

现在有个棘手的问题,求好心达人帮忙:

有一张表,里面有很多投资公司在不同年份投资了不同行业(总共10个行业),比如甲公司在A行业04年投了2次08年投了3次09年投了1次,D行业08年投了8次,F行业如何如何依次类推等等。
甲公司XX年在A行业投了n次为一个Observation(那些没投资的dummy=0我也都有了)。

现在我要得到这些公司在这些年份之前所有的投资行业中哪个最多,哪个第二多,并且算出分别投了多少次。
如果这个太麻烦算出当年这个公司投的最多第二多是哪个行业也成(我自己再想办法推到在这年以前的情况)。

非常急,在线等,求助,谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-8-23 11:56:36
You question is not very clear. Do you want to do a regression to predict the previous years investment count? Or, do you just want to rank the existing data?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-8-23 13:22:34
2# woaiwojia9

我的表达能力果然还是很差诶,不好意思。。。

我是想要当年这个TOP Industry变成一个新的Variable,然后相应的投资次数再一个新的Var(所以说甲公司XX年所有的这两个Var都是这个Industry和相应的投资数)。
依此类推SECOND Industry。



肯定不涉及regression,只根据现有的数据操作的~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-8-24 10:33:43
I don't if I understand you correctly. It will be much helpful if you post some of your data.
data investment;
   input company $ year industry$ count;
   datalines;
  citi 2005 A   4
  citi 2004 b   5
   citi 2007  a  6
  citi  2007  c  8
  citi  2001  d  3
  BOA 2005 d   6
  BOA 2004 c  5
   BOA 2007  f 1
  BOA  2007  b  5
  BOA  2001  a  3

   ;
run;
proc sort data=investment;
   by company ;
run;

proc rank data=investment out=result ties=low descending;
   by company;
   var count;
   ranks countrank;
run;

proc sort data=result;
   by company  countrank;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-8-27 09:35:35
其实感觉问题比较简单,先按公司年份排序
然后针对每一个公司和年份的组合水平计算一下10个行业的投资次数,找出最大的那个行业。
只不过最后的数据合并可能需要用到宏!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群