1 引入NumPy和Pandas
**#1 引入NumPy和Pandas**
import numpy as np
import pandas as pd
2 df[col]方法选取列
**pandas.read_csv()函数可以用来读取csv文件,其主要参数如下:
filepath_or_buffer:数据输入的路径,输入可以是文件路径、URL,可以是实现read方法的任意对象。
sep:读取csv文件时指定的分隔符,默认为逗号。
header:设置导入Datarame的列名称,默认为“infer”。
names:当names没被赋值时,header会变成0,即选取数据文件的第一行作为列名。 当 names 被赋值,header 没被赋值时,那么header会变成None。如果都赋值,就会实现两个参数的组合功能。
index_col:们在读取文件之后,生成的 DataFrame 的索引默认。**
#导入数据
data = pd.read_csv(filepath_or_buffer="dataset/Covid19.csv")
data.head(5) #查看数据的前五行
data.columns #查看data的列名
# 读取某一列
data["corona_result"]
# 读取某一列
data.corona_result
# 读取多列
data[["fever", "cough"]]
3 df.loc[label] 通过标签选取行/列
data.head() #查看数据,默认前5行
# 单行
data.loc[0] #选取数据的第一行
# 多行
data.loc[[1, 7, 3]] #选取索引为1、7、3的数据
# 切片读取行
data.loc[:3] #切片选择数据前四行
# 按行和列读取数据
data.loc[2, "cough"] #读取数据第3行,“cough”的列的数据
# 切片读取
data.loc[:4, "cough":"shortness_of_breath"] #选取数据框前五行,"cough"到"shortness_of_breath"的数据
# 行列任取
data.loc[[2, 1, 0], ["cough", "shortness_of_breath", "corona_result"]]
4 df.iloc[loc]通过位置选择行/列
data.head(n=2) #查看数据前两行
# 第一行
data.iloc[0]
# 切片 - 前三行
data.iloc[:3]
#任选几行
data.iloc[[8, 1, 5]]
```python
data.iloc[[0, 3], [1, 4]]
# 行列都选
data.iloc[0:4, 3:]
5 通过切片方式获取多行/列
d1 = data.loc[:2] #通过切片选取前三行
d1
6 通过布尔向量获取多行/列
# 布尔变量
d1.loc[[True, False, False]] #选取第一行
# 布尔类型
d1[d1["cough"] == 0] #选取“cough”为0的行
# 布尔类型
d1.loc[d1["cough"] == 1] #选取“cough”为1的行
多个布尔类型
d1[(d1["cough"] == 0) & (d1['head_ache'] == 0)]
`
原文地址:https://blog.csdn.net/m0_65523585/article/details/129247741
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.7code.cn/show_23114.html
如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱:suwngjj01@126.com进行投诉反馈,一经查实,立即删除!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。