全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
689 0
2021-09-05
真心求教!请问使用np.digitize进行单个文件数据分组分组可以实现,但批处理bins报错,由于bins只能单调增或者单调减,请问如何才能实现多个文件数据分组的批量处理?
感谢各位不吝指教!

In[11]:
for file in sorted(csv_file_paths):
    #print(file)
    df = pd.read_csv(file, header=0,encoding = 'utf-8',index_col=0)
    #构建划分区间,相邻两条记录间‘时间差>600’‘计算速度<2’则为停止,否则为行驶
    df['tag1'] = df['计算速度'].apply(lambda x: 0 if x < 2 else 1)
    g1 = df.groupby(df['tag1'])
    sbin = g1.get_group(1).index.tolist()
    sbin.append(int(df.index[-1])+1)
    #数据分割,获取分段数据
    df['index'] = df.index
    df['tag2'] = np.digitize(df['index'],bins = sbin)
    g = df.groupby(['tag2'])
    #分段处理数据,获取各段停留状态的时间差的和
    list3 = []
    for name,df in g:
        x = np.array(df['时间差'].values)
        if x.shape[0] == 0:
            continue
        stayTime = df['时间差'].groupby([df['tag1']]).sum()
        if 0 in stayTime.keys().values:#判断0这个索引是否在返回值里边,如果在就打印
            #print(df)
            print(stayTime.values[0])
            #list3.append(stayTime.values[0])

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群