全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1784 4
2017-03-30
批量求数据框中变量的众数及其频率fun1<-function(x){a<-table(x)/length(x)
      m<-data.frame(a)  
      mod_n<-m[which.max(m[,2]),]}
z<-apply(xyfx_model,2,fun1)

得到的结果
> head(z)
$CUST_ID
           x         Freq
1 1000003260 0.00011009

> str(z)
List of 501
$ CUST_ID   


要怎么选出众数频率达到50%的变量
> z[which(z>0.5)]
Error in which(z > 0.5) : (串列)对象不能强制改变成'double'种类


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-3-30 17:33:08
啥叫频率. 众数是最多的是把.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-30 21:36:12
jameschin007 发表于 2017-3-30 17:33
啥叫频率. 众数是最多的是把.
众数的占比1,2,2,3  众数是2,频率0.5
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-30 21:36:12
jameschin007 发表于 2017-3-30 17:33
啥叫频率. 众数是最多的是把.
众数的占比1,2,2,3  众数是2,频率0.5
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-3-31 08:55:55
cindyzmm 发表于 2017-3-30 21:36
众数的占比1,2,2,3  众数是2,频率0.5
select  max(count_A) as maxA,sum(count_A) as TotalA , maxA/TotalA as FreqA from (select count(*) as Count_A , A from df group by A)

假设 dataframe 的名字叫做df, 变量叫做A   只限离散或因子
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群