真心求教！请问使用np.digitize进行单个文件数据分组分组可以实现，但批处理bins报错

689

收藏 2021-09-05

真心求教！请问使用np.digitize进行单个文件数据分组分组可以实现，但批处理bins报错，由于bins只能单调增或者单调减，请问如何才能实现多个文件数据分组的批量处理？
感谢各位不吝指教！

In[11]:
for file in sorted(csv_file_paths):
#print(file)
df = pd.read_csv(file, header=0,encoding = 'utf-8',index_col=0)
#构建划分区间，相邻两条记录间‘时间差>600’‘计算速度<2’则为停止，否则为行驶
df['tag1'] = df['计算速度'].apply(lambda x: 0 if x < 2 else 1)
g1 = df.groupby(df['tag1'])
sbin = g1.get_group(1).index.tolist()
sbin.append(int(df.index[-1])+1)
#数据分割，获取分段数据
df['index'] = df.index
df['tag2'] = np.digitize(df['index'],bins = sbin)
g = df.groupby(['tag2'])
#分段处理数据，获取各段停留状态的时间差的和
list3 = []
for name,df in g:
      x = np.array(df['时间差'].values)
      if x.shape[0] == 0:
         continue
      stayTime = df['时间差'].groupby([df['tag1']]).sum()
      if 0 in stayTime.keys().values:#判断0这个索引是否在返回值里边，如果在就打印
         #print(df)
         print(stayTime.values[0])
         #list3.append(stayTime.values[0])

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群