全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2008 1
2008-11-10

怎样计算如下格式的数据的用户的登陆时长
操作类型中01表示登陆,02表示下线,操作时间20080701073549 则表示2008年7月1号7点35分49秒

终端类型可以不考虑.


号码        操作类型 终端类型 操作时间
727095283 01 1204 20080701073549
727095283 02 1204 20080701074058
727095283 01 1204 20080701081754
726676742 02 1101 20080701113438
726676742 01 1101 20080701134932
727095283 02 1204 20080701122809
727095283 02 1204 20080701144822
726676742 01 1101 20080701075635
726676742 02 1101 20080701084341
726676742 01 1101 20080701084344
726676742 02 1101 20080701085941
726676742 02 1101 20080701091553
726676742 01 1101 20080701091502
727095283 01 1204 20080701122256
726676742 01 1101 20080701092055
726676742 01 1101 20080701092857
726676742 02 1101 20080701092857
726676742 01 1101 20080701095528
726676742 02 1101 20080701095528
726676742 01 1101 20080701101253
726676742 02 1101 20080701101204
726676742 01 1101 20080701101421

有几个问题值得考虑,由于统计周期的限制,有些用户只有登陆行为数据,没有下线行为数据。
该如何使登陆时长的计算不考虑这些数据啊?(注这个数据集大约有500万条记录啊,所以会有点麻烦啊!)
谢谢各位大侠了啊?

 


 

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2008-11-13 02:09:00
727095283 02 1204 20080701122809
727095283 02 1204 20080701144822
这不就是只有下线行为,没有登录行为?这也是可能的吗?

建议你详细的说一下"由于统计周期的限制,有些用户只有登陆行为数据,没有下线行为数据。"到底是什么意思。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群