全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1819 4
2015-06-05
最近需要处理基因文件,文件中有很多缺失值,希望可以通过近邻算法将这些缺失值填补出来,开始学习R还不到一周,网上查了下相关资料很少,有下载impute包,但是总是出错,希望有经验的人可以提供一些信息,在此先谢过了。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-6-5 16:41:47
《R语言实战》这本书有教缺失值处理,在高级方法部分,其中多重插补法可以填补缺失值,具体操作你看书就懂了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-5 16:58:17
-Batistuta- 发表于 2015-6-5 16:41
《R语言实战》这本书有教缺失值处理,在高级方法部分,其中多重插补法可以填补缺失值,具体操作你看书就懂了 ...
我有看书,但是我的数据有个很麻烦的问题在于,不是每一行碱基个数都相等,而且数据很多,看了例子后发现不是很适合我这个例子。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-5 17:05:03
我补充一下我的数据类型:
I           id            1001  1001  1002  1002  1003 1003 ... 1198 1198
M          m01223        A         A      A        A       A        A  ...    A     A
M          m01224        T         T      NA      NA     G        G  ...    G     G
M          m01225        AT       AT    CG       CG    NA       NA ...    T    T
M          m01225       ATCC  ATCC   CGTT   CGTT  AGCC  AGCC ... GTTA GTTA
....
数据很多,而且每一行数据个数也可能不一样,所以进行矩阵转换的时候估计受影响了,所以没办法好好处理,R可以处理这种情况的数据吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-6 10:48:53
小丽子酱 发表于 2015-6-5 16:58
我有看书,但是我的数据有个很麻烦的问题在于,不是每一行碱基个数都相等,而且数据很多,看了例子后发现 ...
那你去Bioconductor看看吧,应该有人解决过这样的问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群