jgchen1966 发表于 2018-11-20 22:50 
问题似没有说清楚:
IDnumber是如何产生的??有意义吗?
when 是节目开始时间,还是结束时间??
老实说,这个数据其实原来连分组名称都没有。别人给我的练习数据。名称都是自己起的以便区分
IDnumber是用户id
when是用户开始看电视的时间(如果刚好播放某电视节目,就是其开始看的时间,所以没有一个数据是准时开播的)
duration是从开始看某个节目到换台的持续时间
原则上认为when没有错误,不过我也检验了其连续性以及剔除了不符合24小时规则的数据。