全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
976 2
2014-03-11
现在在做一个项目,但是有点没有头绪,所以请大神们指教一下!

我现在手里有64张table,关于住户用水的,里面最主要看的一张是日均用水量的,有100万条左右的数据,结构是

account number     &&       reading date 1  &&  consumption1   && .... &&...  reading date 18 && consumption18

所以这里daily average consumption 是consumption(i)/[date(i)-date(i-1)]

现在的想法是首先挑出来outlier 然后用剩下的数据去找到住户typical的用水量是多少     

但是现在就有几个问题,一个是怎么去挑坏数据

第二个是我只知道每一户的类型(比如自家住宅,townhouse,还是商业用地)但是不知道有多少人

用什么方法呢?做回归?还是AMRA?

求大神们指教!在线等!挺急的!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-3-11 07:09:34
宗人 发表于 2014-3-11 06:20
现在在做一个项目,但是有点没有头绪,所以请大神们指教一下!

我现在手里有64张table,关于住户用水的, ...
不懂呀
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-11 07:14:22
yijushi 发表于 2014-3-11 07:09
不懂呀
有64张表,可以直接用ROBOC在R里实现SQL,每张表里都有数据,现在focus一张表,里面的数据主要是日期和用水量
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群