全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
8551 7
2012-09-05
在r中用subset找出一个data.frame 的subset后,看到如下频度统计表,
为什么那些频度为0的还在呢?df的维度已经改变了吧?


summary(df1.lowrisk$Ticker)
    DBR    FRTR  NETHER  EURHYP     BGB     OBL   PBBGR    BTNS    RAGB     BHH    LBBW  WLBANK    AARB   BYLAN  DEXGRP     HVB    RFGB     DPB     BKO
     33      17      17      16      14      11      11       9       9       7       7       7       6       6       6       6       6       5       4
     DB     DHY      GE  HESLAN  MUNHYP   DGHYP   DKRED    HSHN     NAB   NDASS  SHBASS    HSBC  INGDIB      PG  RABOBK  RDSALN    ROSW   STLNO   TOTAL
      4       4       4       4       4       3       3       3       3       3       3       2       2       2       2       2       2       2       2
WESTLB   ALVGR     ANZ   BZLNZ   CADES   CBAAU     COE  COREAL    EFSF     EIB      EU     KFW   LBANK     LGB     MRK     NDB  NOVNVX   POHBK  RENTEN
      2       1       1       1       1       1       1       1       1       1       1       1       1       1       1       1       1       1       1
WESTIB     WMT    WSTP   AALLN   ABBEY   ABESM   ABIBB  ABNANV   ACAFP  AEMSPA  AMXLMM  ASSGEN   ATLIM    BACR   BASGR  BATSLN  BAYNGR    BFCM     BMW
      1       1       1       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0
    BNP  BPCEGP    BPLN    BTPS       C    CAFP   CARLB    CCCI   CEIFP   CEZCP    CMZB      CS   DAIGR  DANBNK   DNBNO     DPW      DT   EADFP     EDF
      0       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0       0
ELEPOR    ENBW  ENELIM    ENFP (Other)
      0       0       0       0       0

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-9-5 13:33:33
你这让大伙怎么帮你呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-9-9 05:49:49
I guess that's due to the variable Ticker is a factor. Use class(df1.lowrisk$Ticker) to confirm this. If so, check the possible choices you have for the factor using levels(df1.lowrisk$Ticker). The results should be the same if you call levels to the original data.frame, i.e. more than what you actually have in df1.lowrisk.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-9-11 01:57:46
To zhangyangsmith,
Yes, you are right. Is it possible to reduce the factors for the subset?
Thanks,
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-9-11 04:59:04
Not in this case. I would suggest to use character instead. Add
复制代码
before set up your data.frame. After you subset the dataset you keep the Ticker variable as character. Calling summary() afterwards will implicitly transform the character into factor before calculating the frequency.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-9-18 23:11:31
Thanks  a lot!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群