北京市摩拜共享单车数据集
2017摩拜算法挑战赛公布的共享单车数据,包括北京市2017年5月两周之内40余万共享单车被30多万用户使用的情况,包括300余万条出行记录。
压缩包包含MOBIKE_CUP_2017.zip、Sample_submission.csv两个文件
MOBIKE_CUP_2017.zip
包括了两个文件,分别是训练集(train.csv)和测试集(test.csv)。其中,train.csv包括了321,4096条出行记录;test.csv包括200,2996条出行记录,但是隐去了骑行目的地的数据,需要选手对其进行预测。
Sample_submission.csv
为提交格式文件。提交文件必须与此文件的格式相符: 在csv文件中,每行为一个骑行订单(orderid), 同时给出预测的最可能的 3 个骑行目的区块位置(geohashed_end_loc)。orderid 和预测的骑行目的地之间,以及3个目的地区块标签 geohashed_end_loc 之间均使用半角逗号作为分隔符。不需要header。
数据文件:
数据字段:数据文件中字段对应的含义如下表所示,其中,部分数据经过脱敏处理。
| 数据 | 含义 |
| orderid | 订单号 |
| userid | 用户ID |
| bikeid | 车辆ID |
| biketype | 车辆类型 |
| starttime | 骑行起始日期时间 |
| geohashed_start_loc | 骑行起始区块位置 |
| geohashed_end_loc | 骑行目的地区块位置(测试集中需要选手预测) |