分组是将数据分为不同类别的过程。下面举一个简单的例子:# import pandas library
import pandas
as pd
raw = {
'Name': [
'John',
'John',
'Grace',
'Grace',
'Benjamin',
'Benjamin',
'Benjamin',
'Benjamin',
'John',
'Alex',
'Alex',
'Alex'],
'Position': [
2,
1,
1,
4,
2,
4,
3,
1,
3,
2,
4,
3],
'Year': [
2009,
2010,
2009,
2010,
2010,
2010,
2011,
2012,
2011,
2013,
2013,
2012],
'Marks':[
408,
398,
422,
376,
401,
380,
396,
388,
356,
402,
368,
378]
}
df = pd.DataFrame(raw)
group = df.groupby(
'Year')
print(group.get_group(
2010))
输出:
Marks Name Position Year
1 398 John
1 2010
3 376 Grace
4 2010
5 380 Benjamin
4 2010
在这个简单的例子中,我们按年分组数据,在本例中是2010年。我们也可以按任何其他列分组,如“名称”,“位置”等。