本文介绍: 拿到一堆数据,首先我们是要对其进行数据的预处理,其中数据存在一些值为空或者是我们不想要的数据,对其进行删除或者是修改数据值。下面是对于该例子进行删除和修改:>>> dfout[]:0 10000 23 男1 15000 34 女2 23000 21 男3 0 20 女4 28500 0 男5 35000 37 男。
前言
拿到一堆数据,首先我们是要对其进行数据的预处理,其中数据存在一些值为空或者是我们不想要的数据,对其进行删除或者是修改数据值。下面是对于该例子进行删除和修改:
>>> df
out[]:
salary age gender
0 10000 23 男
1 15000 34 女
2 23000 21 男
3 0 20 女
4 28500 0 男
5 35000 37 男
一、数据处理
1. df.replace()方法:将“男”用1来表示,“女孩”用0来表示。
>>> df.replace(["男", "女"], [1, 0])
out[]:
salary age gender
0 10000 23 1
1 15000 34 0
2 23000 21 1
3 0 20 0
4 28500 0 1
5 35000 37 1
2. pd.DataFrame.loc()方法来指定列中数据为0的行:
>>> df = df.loc[~((df['salary'] == 0) | (df['age'] == 0))]
>>> df
out[]:
salary age gender
0 10000 23 1
1 15000 34 0
2 23000 21 1
3 35000 37 1
还可以用:
二、删除某行方法的使用
1.删除全行都是为0的行
>>> df.loc[~(df==0).all(axis=1)]
>>> df.loc[(df!=0).any(axis=1)]
>>> new_df = df[df.loc[:]!=0].dropna()
2.用nan替换零,然后删除所有行中数据都为nan的行。之后,将nan替换为零。
import numpy as np
df = df.replace(0, np.nan)# 把0替换成nan
df = df.dropna(how='all', axis=0)# 删除所有为nan的行
df = df.replace(np.nan, 0)# 再把nan替换成0
3.删除某行中某个值为0的行
>>> df= df[df['salary'] != 0]
4.使用lambda函数来删除行
import pandas as pd
import numpy as np
np.random.seed(0)
df = pd.DataFrame(np.random.randn(5,3),
index=['one', 'two', 'three', 'four', 'five'],
columns=list('abc'))
df.loc[['one', 'three']] = 0 # 把第一行和第三行改为0
print(df)
print(df.loc[~df.apply(lambda row: (row==0).all(), axis=1)])
输出为:
要在任何行中删除所有值为0的列:
new_df = df[df.loc[:]!=0].dropna()
new_df
输出为:
原文地址:https://blog.csdn.net/ex_6450/article/details/126867123
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.7code.cn/show_30114.html
如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱:suwngjj01@126.com进行投诉反馈,一经查实,立即删除!
主题授权提示:请在后台主题设置-主题授权-激活主题的正版授权,授权购买:RiTheme官网
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。