Pandas读取xlsx数据（超详细）

本文介绍: 导入和处理数据是数据分析的重要一环。Pand a s是一个强大且流行的Pyt h on库，用于数据处理和分析。在本篇博客中，我们将介绍如何使用Pand as库导入Ex c el 表格，以及一些常用并且实用的操作技巧。

导入和处理数据是数据分析的重要一环。Pand as是一个强大且流行的Pyt h on库，用于数据处理和分析。在本篇博客中，我们将介绍如何使用Pand as库导入Ex cel表格，以及一些常用并且实用的操作技巧。

import pandas as pd

假设我们有一个名为”鸢尾花训练数据.xlsx“（提取码：6666）的Ex cel表格，其中包含我们要导入的数据。使用Pandas的read_excel()函数读取Excel文件并将数据用data接收。注意：num py是以数组形式来读取数据，而pandas是以表格的形式来读取数据。

下面是一个示例代码：

data = pd.read_excel('鸢尾花训练数据.xlsx')

print(data.head())    #查看前几行数据，默认为前5行。

print(data.tail())   #查看后几行数据，默认为后5行。

print(data.info())    #显示数据的基本信息，如列名、数据类型、非空值数量等。

进行数据处理时注意数据重排；训练模型时变量要与标签分离。data是一个DataFrame对象，我们希望选择其中几列作为变量x和y。通过使用[['column_name']]语法，我们将列名放在两层方括号中，如[['萼片长(cm)', '萼片宽(cm)', '花瓣长(cm)', '花瓣宽(cm)']]和[['类型_num']]。这会将这些列作为DataFrame对象返回给变量x和y，以便后续的数据处理和分析。

import pandas as pd
data=pd.read_excel("鸢尾花训练数据.xlsx")

x = data[['萼片长(cm)', '萼片宽(cm)', '花瓣长(cm)', '花瓣宽(cm)']]
y = data[['类型_num']]
print(x)
print(y)

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。