[求助]请高手帮忙看一段程序

蝇子

3958

收藏 2008-04-03

n1<-9802
n2<-3821

for(i in 1:n1){
+ for(j in 1:n2){
+ if((sh1$HHID==sh2$HHID[j]) & (sh1$LINE==sh2$LINE[j])) sh3<-cbind(sh1[i,],sh2[j,])
+ j<-j+1}
+ i<-i+1}

我有两个数据文件分别sh1和sh2，它们有两个共同的变量HHID和LINE（当然各自还有自己的变量），sh1文件中这两个变量下的数据要多些。现在我想寻找这两个文件中这两个变量下相同的数据，并且将这些相同的数据组成文件sh3。

上面是我自己写的程序。请高手帮我看下哪里有问题。

非常感谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

沙发

agan06

2008-4-4 09:09:00

为什么不用SAS，SAS对这样的数据处理很方便。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

藤椅

heavenicefox

2008-4-4 10:29:00

感觉SAS投入太高
产出太低

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

板凳

蝇子

2008-4-4 10:52:00

呵呵，不会用SAS。
那楼上的能不能写个SAS程序呢？
有没有高手能不能帮我看下这个R程序啊？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

报纸

momozilla

2008-4-4 17:31:00

position1 <- match(sh1$HHID, sh2$HHID) & match(sh1$LINE, sh2$LINE)
position2 <- match(sh2$HHID, sh1$HHID) & match(sh2$LINE, sh1$LINE)

tmp1 <- sh1[!is.na(position1),]
tmp2 <- sh2[!is.na(position2),]

out <- rbind(tmp1, tmp2)

p.s. you use "for" loop a little bit wrongly, please refer to R manual

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

地板

蝇子

2008-4-4 20:01:00

谢谢楼上的！你的这种方法确实不错。不过在运行时会显示两个tmp1和tmp2数据长度不一致。
我用merge（）行么？？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

7楼

momozilla

2008-4-4 23:26:00

除非是规定了sh1和sh2的那两个变量之间有什么关系，否则tmp1和tmp2的长度没有关系
tmp1是sh1中与sh2数据相同的那一部分，后者则是sh2中与sh1相同的部分
从你所说，你想分别从两个数据中挑出某两个变量有相同数值的cases，并组成一个新数据
如果是，那么把tmp1和tmp2用emerge并列起来是不对的
只需简单地rbind就行

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

8楼

蝇子

2008-4-5 10:06:00

我是想从从两个数据中挑出某两个变量有相同数值的cases，并连同其它变量一起组成新的数据文件。

这样不行么

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

9楼

momozilla

2008-4-7 07:17:00

按你的说法，假设 sh1 和 srh2 分别如下：

sh1
HHID LINE otherVar
1 30 1
8 23 2
2 27 3
2 23 4
5 24 5
7 21 6
6 22 7
9 29 8
10 26 9
8 24 10
7 30 11
10 27 12
9 25 13
4 24 14
3 25 15

sh2
HHID LINE otherVAR
15 30 1
10 28 2
15 29 3
11 30 4
6 27 5
7 27 6
12 27 7
12 25 8
6 26 9
9 30 10

按我的程序
position1 <- match(sh1$a, sh2$a) & match(sh1$b, sh2$b)
position2 <- match(sh2$a, sh1$a) & match(sh2$b, sh1$b)

tmp1 <- sh1[!is.na(position1),]
tmp2 <- sh2[!is.na(position2),]

我不明白，有什么理由一定保证 tmp1 和 tmp2 会有同样的长度，并且能把tmp1 和 tmp2并列起来？！(你知不知道并列起来将意味着什么？）
我更不明白，是我没说清楚，还是你根本就没有真正明白你想要解决的问题！

P.S. 请不要在标题上注明什么“高手”。就你目前的水平，根本无须高手来回答你，真正的高手也根本不屑回答你这么如此初级、而且不带自己思考的问题。换句话说，你现在的有这样那样的问题，只是因为你不努力学习，跟高手不高手的一点关系都没有。这么初级的问题还一问再问！如果你就想着别人帮你解决一切，而实在懒得自己去思考，那么，我的忠告是：S-Plus/R根本不适合你，你不妨于学别的软件。学习R的人，不一定都是很聪明的（比如我），但一定是很勤奋的、至少是勤于思考的（比如我）。我不是没问题，但我没有像你这种自己不努力学习、不自己思考、而只会张嘴就问的问题。如果你无法接受我这些话，那么你真的应该放弃S-Plus/R了。

Good Luck!

[此贴子已经被作者于2008-4-7 7:21:42编辑过]

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

10楼

蝇子

2008-4-7 09:30:00

不好意思，我想我明白你的意思，是我没表述清楚。两个文件中的其它变量个数是不一样的，所以用rbind（）不对。不管怎么样，我现在得到我要的结果了。谢谢。
P.S.我承认我现在是过于懒惰了，接受批评。我觉得有时候得到别人的指点学习比一个人学习要好。我标题上写“高手”是觉得比我强的都是高手。
Thank You！

[此贴子已经被作者于2008-4-7 9:35:26编辑过]

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

11楼

ruiqwy

2008-4-7 12:17:00

R的优势在于矩阵运算，编程时最好不用用循环！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

On the Robustness of Unit Root Tests in the Presence of Double Unit Roots

论坛开张并诚招版主

庆祝论坛开张并诚招版主

有志于报考人大经济学院的同学朋友们看过来

庆祝论坛开张并诚招各分论坛版主

On the Robustness of Unit Root Tests in the Presence of Double Unit Roots

双单位根存在情况下单位根检验的稳健性研究

Local Power Functions of Tests for Double Unit Roots

周小川：调利率还需观察息口盯住5%通胀率

栏目导航

R语言论坛

经管文库（原现金交易版）

经管高考

外语学习

文献求助专区

金融学（理论版）

热门文章

2026年未来产业十大赛道

2026中小企业加快前沿技术创新发展研究报告 ...

电子行业专题研究：AI驱动先进硅片需求高增 ...

2025-2026年中国绿色消费行为白皮书

AI幻觉深度研究报告-清新研究-202604

公用事业行业：AI对用电的影响

2026巨量引擎教育行业营销白皮书-巨量引擎- ...

A general framework for observation driv ...

求下一篇英文文章

CDA数据分析脱产就业班在2026年3月7日开班了 ...

推荐文章

【文献求助专区】版主工作备用贴

五一充电，学术突围！四大AI赋能王牌课程， ...

关于学术研究和论文发表的一些建议

几种免费下载文献的方法----我的文献应助经

【必看】【本版版规，欢迎发悬赏贴求助】

【新课】26年3月｜Gemini辅助论文写作与数据 ...

关于如何利用文献的若干建议

关于科研中如何学习基础知识的一些建议 (一 ...

一个自编的经济学建模小案例 --写给授课本科 ...

AI智能体赋能教学改革: 全国AI教育教学应用 ...

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群