现有两个表,一个表是节目单简称A表,变量是频道ID、频道名称、节目名称,节目播出日期,节目播出开始时间,节目播出结束时间。A表一个月的节目单有近10万条数据,如频道ID 频道名称 节目名称 节目播出日期 节目播出开始时间 节目播出结束时间
| 22201011 | 重庆卫视 | 车世界 | 2014-03-01 | 01MAR2014:11:40:04 | 01MAR2014:12:00:02 |
| 22201011 | 重庆卫视 | TICO欢乐假日:阿U乐园:U爸的午餐 | 2014-03-01 | 01MAR2014:13:58:31 | 01MAR2014:14:02:59 |
| 22201011 | 重庆卫视 | TICO欢乐假日:猪猪侠变身小英雄(48) | 2014-03-01 | 01MAR2014:16:18:07 | 01MAR2014:16:36:30 |
| 21101011 | 浙江卫视 | 大丈夫(2) | 2014-03-01 | 01MAR2014:13:22:26 | 01MAR2014:14:17:07 |
| 21101011 | 浙江卫视 | 浙江新闻联播 | 2014-03-01 | 01MAR2014:18:30:03 | 01MAR2014:18:52:58 |
| 21101011 | 浙江卫视 | 大丈夫(36) | 2014-03-01 | 01MAR2014:20:23:10 | 01MAR2014:21:13:14 |
| 22501011 | 云南卫视 | 云南新闻联播 | 2014-03-01 | 01MAR2014:18:30:03 | 01MAR2014:18:55:03 |
| 22702041 | 西安文化影视 | 武林外传(68) | 2014-03-01 | 01MAR2014:07:51:48 | 01MAR2014:08:52:17 |
B表(1个月30天数据有1亿4千万条)是收看直播的表 变量为 频道ID 频道名称 收看日期 收看频道开始时间 收看频道结束时间 如下
频道ID 频道名称 收看日期 收看频道开始时间 收看频道结束时间
| 40901221 | 东方购物 | 2014-03-01 | 01MAR2014:09:29:21 | 01MAR2014:09:29:45 |
| 22101011 | 旅游卫视 | 2014-03-01 | 01MAR2014:17:05:24 | 01MAR2014:17:05:33 |
| 22201011 | 重庆卫视 | 2014-03-01 | 01MAR2014:21:06:56 | 01MAR2014:21:07:03 |
| 20001071 | CCTV-7 | 2014-03-01 | 01MAR2014:23:49:51 | 01MAR2014:23:50:13 |
| 20001141 | CCTV-少儿 | 2014-03-01 | 01MAR2014:19:28:19 | 01MAR2014:19:28:35 |
| 20001141 | CCTV-少儿 | 2014-03-01 | 01MAR2014:15:32:03 | 01MAR2014:17:56:58 |
| 20001081 | CCTV-8 | 2014-03-01 | 01MAR2014:20:47:33 | 01MAR2014:20:47:44 |
| 20001041 | CCTV-4 | 2014-03-01 | 01MAR2014:07:26:21 | 01MAR2014:07:51:26 |
现 想计算各节目的 收视时长,如节目单A表是3月1号播出的节目 在B表3月1号的 收视时长 如一个节目是否被收看有四种可能,单个节目可以算出来,但是如何批量计算,两个表的连接是多对多,HASH? 请各大侠,大牛指教,小弟膜拜