全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
1529 2
2018-02-28
数据格式如下:
捕获.PNG

data.xlsx
大小:(10.27 KB)

 马上下载


有两列,现在要做的是在chr相同的情况下,找到跨度为150的范围内的数据至少有三个,举个例子:第2行和第3行都属于chr1,但是878302+150小于第3行的969664,所以这一行数据应该删除,同理第3行的969664+150小于第4行,所以也应该删除。然后第4、5行的跨度小于150,但是只有两个数据,所以也删除。
第8、9、10、11行跨度在150以内,且数据量为4个,所以这一部分留下来(不知道我说清楚没有),当然,这些都要在第一列相同的情况下。
请问这个代码该怎么写呢?数据已上传。
附件列表
捕获.PNG

原图尺寸 9.21 KB

捕获.PNG

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-2-28 12:02:16
自定义函数,新生成一列(数值=前数字-后数字);
循环遍历,每个相同chr下,累加新生成列的数值之和,和小于150的,保留i相应的ndex;
取出index对应的列
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-2-28 12:28:33
Studio-R 发表于 2018-2-28 12:02
自定义函数,新生成一列(数值=前数字-后数字);
循环遍历,每个相同chr下,累加新生成列的数值之和,和小 ...
谢谢,我去试试
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群