一、groupby 能做什么?
groupby函数主要的作用是进行数据的分组以及分组后地组内运算!
于数据的分组和分组运算主要是指groupby函数的应用,具体函数的规则如下:
df[](指输出数据的结果属性名称).groupby([df[属性],df[属性])(指分类的属性,数据的限定定语,可以有多个).mean()(对于数据的计算方式——函数名称)
举例如下:
print(df["评分"].groupby([df["地区"],df["类型"]]).mean())
上面语句的功能是输出表格所有数据中不同地区不同类型的评分数据平均值。
二、单类分组
2.1 创建数据集
lst1 = [['小红', '女', 1, 160], ['大红', '女', 2, 161], ['小明', '男', 1, 180], ['大明', '男', 1, 180], ['小亮', '男', 2, 170]]
lst2 = [['姓名', '性别', '班级', '身高']]
data = pd.DataFrame(lst1, columns = lst2)
data
data.groupby("性别")
结果为:
<pandas.core.groupby.generic.DataFrameGroupBy object at 0x0000018CD0F0AB90>
想要按照【性别】进行分组
data.groupby('性别').describe()
但是,我们并不需要统计班级的均值等信息,只需要【身高】,所以做一下小的改动:
data.groupby('性别')['身高'].describe()
三、多类分组
data.groupby(['班级', '性别'])
data.groupby(['班级', '性别']).mean()
单独用groupby,我们得到的还是一个 Groupby对象。
import numpy as np
data.groupby( ["班级","性别"]).agg([np.sum, np.mean, np.std])
原文地址:https://blog.csdn.net/wzk4869/article/details/128375321
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.7code.cn/show_22174.html
如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱:suwngjj01@126.com进行投诉反馈,一经查实,立即删除!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。