深入理解 Pandas 分组聚合:从基础到进阶
在数据分析中,分组聚合操作是不可或缺的,它让我们能够轻松地从数据中提取出有价值的信息。pandas 库提供了强大且灵活的工具来实现这一目标,主要通过 groupby() 方法进行分组和聚合操作。本文将详细介绍 Pandas 的分组聚合用法,并通过简单的案例来帮助读者理解这些概念。
什么是分组聚合?
分组聚合是指将数据按某些条件进行分组,然后对每组数据进行某种计算,如求和、平均值、计数等。它通常包括两个步骤:
使用 groupby() 进行分组。
使用聚合函数对分组后的数据进行汇总。
一个简单的案例
我们先通过一个简单的数据集来演示分组聚合操作:
import pandas as pd
# 创建数据集
data = {
'城市': ['北京', '上海', '广州', '北京', '广州', '上海', '北京'],
'销售额': [100, 200, 150, 80, 120, 250, 90],
'月份': ['一月', '一月', '一月', '二月', '二月', '二月', '三月']
}
df = pd.DataFrame(data)
print(df)
输出的 DataFrame 如下:
城市 销售额 月份
0 北京 100 一月
1 上海 200 一月
2 广州 150 一月
3 北京 80 二月
4 广州 120 二月
5 上海 250 二月
6 北