[1224]Pandas常用的遍历方法

本文介绍: 其中，i t errows 方法返回一个迭代器，可以逐行遍历Da t aFram e，返回每一行数据的索引和值。总的来说，对于大型的 Pand a s Da t aFram e，应该尽量避免使用循环遍历，而是使用 Pand a s 内置的方法，如 apply() 和 ap ply map() 等。a p ply map() 方法可以应用一个函数到 Da taFram e 中的每一个元素，返回一个新的 DataFram e。ap ply() 方法可以应用一个函数到 DataFram e 中的每一个元素，返回一个新的 DataFram e。

使用 for 循环可以遍历 DataFrame 中的每一行或每一列。需要使用 iterrows() 方法遍历每一行，或者使用 iteritem s() 方法遍历每一列。

代码如下：

import pandas as pd

# 创建 DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35],
    'gender': ['F', 'M', 'M']
}
df = pd.DataFrame(data)

# 遍历每一行
for index, row in df.iterrows():
    print(f"Index: {index}, Row: {row['name']}, {row['age']}, {row['gender']}")

# 遍历每一列
for column, value in df.iteritems():
    print(f"Column: {column}")
    print(value)

ap ply() 方法可以应用一个函数到 DataFrame 中的每一个元素，返回一个新的 DataFrame。

import pandas as pd

# 创建 DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35],
    'gender': ['F', 'M', 'M']
}
df = pd.DataFrame(data)

# 定义一个函数，对每一个元素加 1
def add_one(x):
    return x + 1

# 应用函数到 DataFrame
df_new = df.apply(add_one)
print(df_new)

import pandas as pd

df = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})

df["C"] = df["B"].apply(lambda x: x * 2)

输出结果如下：

   A  B  C
0  1  3  6
1  2  4  8

其中，ap ply 方法接受一个函数作为参数，该函数的输入是该列的每一个值，输出是计算结果。

import pandas as pd

# 创建 DataFrame
data = {
    'name': ['Alice', 'Bob', 'Charlie'],
    'age': [25, 30, 35],
    'gender': ['F', 'M', 'M']
}
df = pd.DataFrame(data)

# 定义一个函数，对每一个元素加 1
def add_one(x):
    return x + 1

# 应用函数到 DataFrame
df_new = df.applymap(add_one)
print(df_new)

import pandas as pd

# 创建 Series
s = pd.Series([1, 2, 3])

# 定义一个函数，对每一个元素加 1
def add_one(x):
    return x + 1

# 应用函数到 Series
s_new = s.map(add_one)
print(s_new)

import pandas as pd

df = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})

for index, row in df.iterrows():
    print(index, row)

0 A    1
  B    3
1 A    2
  B    4
dtype: int64

for col_label, column in df.iteritems():
    print(col_label)
    print(column)

for row in df.itertuples(index=False):
    print(row)

import pandas as pd

df = pd.DataFrame({'A': [1, 2], 'B': [3, 4]})

for row in df.itertuples():
    print(row.Index, row.A, row.B)

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

a d p

文章 目录

for 循环遍历每一行/列

ap ply() 方法

ap ply map() 方法

map() 方法

iterrows()方法

iteritems()方法

itertuples()方法

发表回复取消回复

for 循环遍历每一行/列

apply() 方法

applymap() 方法