全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2304 2
2018-02-27
悬赏 20 个论坛币 已解决
数据格式如下,希望按行进行统计每个值出现的频数,最终生成一个二维表。

原始数据格式:
rownames

B73.AGPv3

X100462248

X100462250

146943

G

T

T

146945

A

C

C

146987

C

A

A

146994

A

A

A

146995

C

A

A


希望得到的结果:
rownames

A

T

G

C

146943

2

1

146945

1

2

146987

2

1

146994

3

146995

2

1


snp1.xlsx

大小:10.48 KB

 马上下载

最佳答案

xing035400 查看完整内容

library(dplyr) library(xlsx) library(reshape2) setwd("C:\\Users\\Administrator\\Desktop") data% select(-2) %>% dcast(rownames~value,length,fill = NULL,drop=TRUE) 因为有缺失值所以分类中出现NA,你可以在数据清洗时,按自己意愿修改缺失部分。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-2-27 15:00:25
library(dplyr)
library(xlsx)
library(reshape2)
setwd("C:\\Users\\Administrator\\Desktop")
data<- read.xlsx2("snp1.xlsx",1)
data <- data %>%
        melt(id.vars = c("rownames"))  %>%
        select(-2) %>%
        dcast(rownames~value,length,fill = NULL,drop=TRUE)

QQ截图20180228111458.png


因为有缺失值所以分类中出现NA,你可以在数据清洗时,按自己意愿修改缺失部分。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-27 15:40:32
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群