【python数据分析基础】—pandas中loc()与iloc()的介绍与区别

本文介绍: pandas中loc()与iloc()的介绍与区别

文章 目录

前言
一、loc[]函数
二、iloc[]函数
三、详细用法
- loc方法
- iloc方法
总结
- 共同点
- 不同点

前言

我们经常在寻找数据的某行或者某列的时常用到Pand a s中的两种方法 iloc和loc，两种方法都接收两个参数，第一个参数是行的范围，第二个参数是列的范围。

一、loc[]函数

loc：
- 接收的是行、列的名称或标签。
- 在切片是按闭区间切片，也就是区间两边都能取到。

二、iloc[]函数

iloc：
- 接收的是行、列的索引位置（下标，从0开始）。
- 按传统的左闭右开的的方式切片。

三、详细用法

创建用于测试的数据表 dataframe：

import pandas as pd
data={'state':['Ohio','Ohio','Ohio','Nevada','Nevada'],
      'year':[2000,2001,2002,2001,2002],
      'pop':[1.5,1.7,3.6,2.4,2.9]}

frame=pd.DataFrame(data)
frame.index=list('abcde') 
frame

在这里插入图片描述

loc 方法

1、单个行名/列名或行名/列名的列表

要求：读取第2行，行名为’b’。

frame.loc['b']

在这里插入图片描述

注意： 上面这种写法，运行“print(type(frame.loc[‘b’]))”可以知道返回的是<class ‘pandas.core.series.Series’&g t;对象，如果要<class ‘pandas.core.frame.DataFrame’&g t;对象可以改成frame.loc[[‘b’]]。

frame.loc[['b']]

在这里插入图片描述
要求：取第1、2列的第2与第5行，第1、2列的列名分别为’state’与’year’，第2、5行的行名分别为’b’和’e’。

frame.loc[['b','e'],['state','year']]

在这里插入图片描述

2、列名/行名的切片

要求：读取第2列，列名为’year’。

frame.loc[:,'year']  #返回的是&lt;class 'pandas.core.series.Series'&gt;对象。

在这里插入图片描述

frame.loc[:,['year']] #返回的是<class 'pandas.core.frame.DataFrame'&gt;对象。

在这里插入图片描述

要求：取第2行第3列，第2行行名为’b’，第3列列名为’pop’。

frame.loc['b','pop']

在这里插入图片描述

要求：读取dataframe某个区域，比如第3列的第2到第5行，第3列为”pop”列，第2到第5行即b行到e行。

frame.loc['b':'e','pop'] #返回的是<class 'pandas.core.series.Series'>对象。

在这里插入图片描述

frame.loc['b':'e',['pop']] #返回的是<class 'pandas.core.frame.DataFrame'>对象。

在这里插入图片描述

要求：取第1、2列的第2到第5行，第1、2列的列名分别为’state’和’yea‘列，第2、5行的行名为’b’和‘e’行。

frame.loc['b':'e','state':'year'] #返回的是<class 'pandas.core.frame.DataFrame'>对象。

在这里插入图片描述

3、返回布尔型列表的表达式（判断或函数）

要求：根据判断条件读取，取第3列大于2的。

frame.loc[frame['pop']>2,'pop'] #返回的是<class 'pandas.core.series.Series'>对象。

在这里插入图片描述

frame.loc[frame['pop']>2,['pop']] #返回的是<class 'pandas.core.frame.DataFrame'>对象。

在这里插入图片描述

要求：根据函数读取，取第3列大于2的所有行与列。

frame.loc[lambda x: x['pop']>2]

在这里插入图片描述

iloc方法

1、单个下标或若干下标构成的列表，从0开始。

要求：取第2行的值。

frame.iloc[1]

在这里插入图片描述
注意： 上面这种写法，运行”print(type(frame.iloc[1]]))”可以知道返回的是<clas s ‘pandas.core.series.Series’>对象，如果要<class ‘pandas.core.frame.DataFrame’>对象可以改成frame.iloc[[1]]。

frame.iloc[[1]]

在这里插入图片描述
要求：取第1、2列的第2与第5行。

frame.iloc[[1,4],[0,1]]

在这里插入图片描述

2、下标的切片

要求：取第2列的值。

frame.iloc[:,1] #返回的是<class 'pandas.core.series.Series'>对象。

在这里插入图片描述

frame.iloc[:,[1]]  #返回的是<class 'pandas.core.frame.DataFrame'>对象。

在这里插入图片描述

要求：取第2行第3列

frame.iloc[1,2]

在这里插入图片描述

要求：读取dataframe某个区域，比如第3列的第2到第5行。

frame.iloc[1:5,2]  #返回的是<class 'pandas.core.series.Series'>对象。

在这里插入图片描述

frame.iloc[1:5,[2]] #返回的是<class 'pandas.core.frame.DataFrame'>对象。

在这里插入图片描述

要求：取第1、2列的第2到第5行。

frame.iloc[1:5,0:2] #因为是.iloc[]中用:表示从第几行/列到第几行/列是左闭右开的的方式，因此这里下标3表示第四行与第四列是取不到的。

frame.iloc[[1,2,3,4],[0,1]] #第二种写法

在这里插入图片描述

3、可以返回合理值的函数

要求：当DataFrame的index是整数，取index为偶数的记录。

import pandas as pd
data={'state':['Ohio','Ohio','Ohio','Nevada','Nevada'],
      'year':[2000,2001,2002,2001,2002],
      'pop':[1.5,1.7,3.6,2.4,2.9]}

frame=pd.DataFrame(data)
frame

frame.iloc[lambda x: x.index % 2 == 0]

在这里插入图片描述

总结

共同点

两者都接收两个参数，第一个参数是行的范围，第二个参数是列的范围。
两者都可以有行索引值没有列索引值，但有列索引值前必须得有行索引值，但loc[]行索引值只能为名称形式来取，不能按下标形式来取。iloc[]则相反。

取第三列，无论使用loc[]函数还是iloc[]函数，如果没有行索引都会报错。

frame.loc['pop']
frame.loc[,'pop']
frame.iloc[,3]

不同点

1、loc[]函数接收的是行/列的名称（可以是整数或者字符），iloc[]函数接收的是行/列的下标（从0开始），不能是字符。
2、loc[]函数在切片时是按闭区间切片的，也就是区间两边都能取到，iloc[]函数则是按传统的左闭右开的方式切片的。

参考文章：
https://blog.csdn.net/weixin_43298886/article/details/112632237
https://blog.csdn.net/Leon_Kbl/article/details/97492966

原文地址:https://blog.csdn.net/sodaloveer/article/details/133032337

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。

如若转载，请注明出处：http://www.7code.cn/show_6925.html

如若内容造成侵权/违法违规/事实不符，请联系代码007邮箱：suwngjj01@126.com进行投诉反馈，一经查实，立即删除！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

前言

一、loc[]函数

二、iloc[]函数

三、详细用法

loc方法

iloc方法

共同点

不同点

相关文章

发表回复 取消回复

loc 方法

发表回复取消回复