全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
3585 2
2012-03-19
悬赏 5 个论坛币 未解决
数据是alliance方面的,原始的Excel文件60+M,我只把涉及到的3列拷了出来。目的是看focal的公司某年有多少个partner,以前是否有合作过,其中R&D的alliance又有多少。
部分数据:

Alliance
    Date
    Announced

Participant
    Ultimate Parent Name

Activity
    Description

1/1/1982

Green  Cross Corp
    Grupo Grifols SA

Manufacturing  Services

1/1/1982

L'Oreal  SA
    Fujisawa Pharmaceutical Co Ltd

Manufacturing  Services

1/1/1983

Novo  Industri AS
    Connaught Biosciences Inc

Marketing  Services

12/1/1984

Astellas  Pharma Inc
    Eli Lilly & Co

Research  & Development Services
    Marketing Services

1/1/1985

Green  Cross Corp
    Biogen Inc

Licensing  Services
    Research & Development Services

1/1/1985

Biotechnology  Investments Ltd
    Immunetech Pharmaceuticals

1/1/1985

Astellas  Pharma Inc
    Rorer Group Inc

Licensing  Services
    Marketing Services

1/1/1985

Toyobo  Co Ltd
    Genetics Technology

Licensing  Services

1/1/1985

LCF  Rothschild Group
    Immunetech Pharmaceuticals

1/1/1985

Pharmacia  ENI
    Hoechst AG

Licensing  Services




目前的问题就是stata如果用insheet指令的话,一格中如果有硬回车就会被忽略成空格,而本来有些词组就有空格,所以没法split成partner1, partner2; description1, description2...

毫无头绪,求指点。
Book.xlsx
大小:(344.27 KB)

 马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-3-19 10:04:13
只能在你9087行 里调整,或按规律拷贝出来,才可去掉空格。或者下载时选择一种其他的保存方式,如文本方式,再分栏
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-19 16:53:05
liexiagao 发表于 2012-3-19 10:04
只能在你9087行 里调整,或按规律拷贝出来,才可去掉空格。或者下载时选择一种其他的保存方式,如文本方式, ...
呃……这个就是原始数据,没有其他格式了……

个人瞎琢磨的lame方案来了:

拷出两列(比如date和firm name)到Word,convert to text,再convert to table,大概是这个造型——
                       date                                        firm

1/1/1982

Green Cross Corp
Grupo Grifols SA

1/1/1982

L'Oreal SA
Fujisawa Pharmaceutical Co Ltd

1/1/1983

Novo Industri AS
Connaught Biosciences Inc

12/1/1984

Astellas Pharma Inc
Eli Lilly & Co

1/1/1985

Green Cross Corp
Biogen Inc

1/1/1985

Biotechnology Investments Ltd
Immunetech Pharmaceuticals

1/1/1985

Astellas Pharma Inc
Rorer Group Inc

1/1/1985

Toyobo Co Ltd
Genetics Technology

1/1/1985

LCF Rothschild Group
Immunetech Pharmaceuticals

1/1/1985

Pharmacia ENI
Hoechst AG

然后拷到stata,运行
gen wp=0
replace wp=1 if firm==""
replace firm = date if wp==1
replace date ="" if wp==1


得到的结果就大体是这样了……

datefirmwp

1/1/1982

Green Cross Corp

0

Grupo Grifols SA

1

1/1/1982

L'Oreal SA

0

Fujisawa Pharmaceutical Co Ltd

1

1/1/1983

Novo Industri AS

0

Connaught Biosciences Inc

1

12/1/1984

Astellas Pharma Inc

0

Eli Lilly & Co

1

1/1/1985

Green Cross Corp

0

Biogen Inc

1

1/1/1985

Biotechnology Investments Ltd

0

Immunetech Pharmaceuticals

1




然后再给每个alliance赋个id,把date补齐;同理把date和description做一遍,然后通过统一的id再merge到一块儿。
不直接把3列都convert to text再convert to table是因为在转回table的时候word只能生成2列column,3列一起转name和description就混一块儿了。

求优化
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群