本文介绍: 场景:在通过 Pandas 读取数据时,经常因为数据类型被改变,如分类用的数字时间202309被当做数值显示202.309k ,或长ID字段被判定为数值类型导致ID长度溢出截取,因此需要对Pandas读取数据后再转换成后续方便处理字段类型。Pandas 提供了多种方法来改变 DataFrame字段(列)的格式,包括数据类型日期时间格式数字格式等。

场景:在通过 Pandas 读取数据时,经常因为数据类型被改变,如分类用的数字时间202309被当做数值显示202.309k ,或长ID字段被判定为数值类型导致ID长度溢出截取,因此需要对Pandas读取数据后再转换成后续方便处理字段类型。

Pandas 提供了多种方法来改变 DataFrame字段(列)的格式,包括数据类型日期时间格式数字格式等。以下是一些常见操作

1.更改数据类型dtype

使用 astype() 方法可以将某一列的数据类型更改为另一种类型。例如,将整数转换浮点数,或将字符串列转换为日期时间格式

pythonCopy codeimport pandas as pd

# 创建一个示例 DataFrame
data = {'列1': [1, 2, 3],
        '列2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# 将列1的数据类型整数改为浮点数
df['列1'] = df['列1'].astype(float)

2.更改日期时间格式

:如果你有日期时间数据可以使用 to_datetime() 方法将字符串列转换为日期时间对象,并设置日期时间格式

pythonCopy codedf['日期列'] = pd.to_datetime(df['日期列'], format='%Y-%m-%d')

3.更改数字格式

:你可以使用字符串格式化更改数字列的显示方式例如保留小数位数添加千位分隔符等。

pythonCopy codedf['金额列'] = df['金额列'].apply(lambda x: '{:,.2f}'.format(x))

4.更改字符串格式

:你可以使用字符串方法来更改文本列的格式,例如大小写转换、字符串拼接等。

pythonCopy codedf['文本列'] = df['文本列'].str.upper()
5.更改布尔格式

:你可以使用 astype() 方法将布尔列转换为整数(0或1)或其他布尔表示方式

pythonCopy codedf['布尔列'] = df['布尔列'].astype(int)  # 将布尔列转换为整数(0或1)

请根据你的具体需求数据类型选择适当的方法来改变字段的格式。这些示例展示了一些常见操作,但 Pandas 提供了更多的方法和选项处理不同的数据格式

原文地址:https://blog.csdn.net/weixin_57753116/article/details/132879948

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_21536.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注