全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2321 2
2015-04-24
首先先说一下背景, OD分析里面,出发地10个,目的地10个,我最终目的是要从数万数据里面筛选出来这些OD样本,并各自乘以系数扩大,做成10*10的矩阵。样本的数值范围是0-100,分别对应前面说的大区的编码1-10,
我想对样本进行筛选,因为样本的值域范围是 0-100,我分了四个区间,0-25,25-50,50-75,75-100, 想请教大神怎么能对这数万的数据中(原始样本数据表,用csv导入),怎么从这里面筛选出来这些区间?
因为我需要针对每个不同的区间分别编写对应的函数最后求和,导入我想做的那个10*10矩阵,

举个例子,从10*10的矩阵 纵坐标代表出发地O,横坐标代表目的地D,矩阵第一个值 O1D1 的含义其实是 根据不同大区1,到目的地大区1,这样一个对应关系下,筛选出四个数值区域,然后分别乘以对应的系数(这里还需要一个筛选,或者说怎么能定位一个串联的筛选,因为这些数组的对应关联是大区代码1-10)扩大,

所以。。。唉 我纠结了,要死了。。。我现在已经迷茫到不知道怎么筛选了,
如果只做数学,那我就用excel 筛选出来对应表格然后A*B 两个数组就好,可是这样工作量太大,相当于 1-1 一个表 1-2 一个表 1-3 一个表,。。。。组合太多,,,心有余而力不足,所以就想用R做这样几个筛选,恳求大神指点迷津。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-4-24 17:59:26
据你的描述,我的理解是这样的。
(1)给你的原始数据里的每个值取一个分类值。用O*10+D的方法。得到0-99的分类值
(2)对分类值进行cut()控制因素分类。
(3)按因素分情况处理
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-25 13:11:00
nuomin 发表于 2015-4-24 17:59
据你的描述,我的理解是这样的。
(1)给你的原始数据里的每个值取一个分类值。用O*10+D的方法。得到0-99的 ...
好的,大哥我做做试试,做出来再跟您请教
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群