r中截取subset的问题，谢！！

8817

收藏 2012-09-05

在r中用subset找出一个data.frame 的subset后，看到如下频度统计表，
为什么那些频度为0的还在呢？df的维度已经改变了吧？

summary(df1.lowrisk$Ticker)
DBR FRTR  NETHER  EURHYP    BGB    OBL PBBGR BTNS RAGB    BHH LBBW  WLBANK AARB BYLAN  DEXGRP    HVB RFGB    DPB    BKO
   33    17    17    16    14    11    11    9    9    7    7    7    6    6    6    6    6    5    4
   DB    DHY    GE  HESLAN  MUNHYP DGHYP DKRED HSHN    NAB NDASS  SHBASS HSBC  INGDIB    PG  RABOBK  RDSALN ROSW STLNO TOTAL
   4    4    4    4    4    3    3    3    3    3    3    2    2    2    2    2    2    2    2
WESTLB ALVGR    ANZ BZLNZ CADES CBAAU    COE  COREAL EFSF    EIB    EU    KFW LBANK    LGB    MRK    NDB  NOVNVX POHBK  RENTEN
   2    1    1    1    1    1    1    1    1    1    1    1    1    1    1    1    1    1    1
WESTIB    WMT WSTP AALLN ABBEY ABESM ABIBB  ABNANV ACAFP  AEMSPA  AMXLMM  ASSGEN ATLIM BACR BASGR  BATSLN  BAYNGR BFCM    BMW
   1    1    1    0    0    0    0    0    0    0    0    0    0    0    0    0    0    0    0
BNP  BPCEGP BPLN BTPS    C CAFP CARLB CCCI CEIFP CEZCP CMZB    CS DAIGR  DANBNK DNBNO    DPW    DT EADFP    EDF
   0    0    0    0    0    0    0    0    0    0    0    0    0    0    0    0    0    0    0
ELEPOR ENBW  ENELIM ENFP (Other)
   0    0    0    0    0

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

qoiqpwqr

2012-9-5 13:33:33

你这让大伙怎么帮你呢？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zhangyangsmith

2012-9-9 05:49:49

I guess that's due to the variable Ticker is a factor. Use class(df1.lowrisk$Ticker) to confirm this. If so, check the possible choices you have for the factor using levels(df1.lowrisk$Ticker). The results should be the same if you call levels to the original data.frame, i.e. more than what you actually have in df1.lowrisk.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

jq279

2012-9-11 01:57:46

To zhangyangsmith,
Yes, you are right. Is it possible to reduce the factors for the subset?
Thanks,

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zhangyangsmith

2012-9-11 04:59:04

Not in this case. I would suggest to use character instead. Add

复制代码

before set up your data.frame. After you subset the dataset you keep the Ticker variable as character. Calling summary() afterwards will implicitly transform the character into factor before calculating the frequency.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

jq279

2012-9-18 23:11:31

Thanks a lot!!!

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群