在数据处理时,经常会因为index报错而发愁。不要紧,本次来和大家聊聊pandas
中处理索引的几种常用方法。
1.读取时指定索引列
很多情况下,我们的数据源是 CSV 文件。假设有一个名为的文件data.csv
,包含以下数据。
默认情况下,pandas
将会创建一个从0开始的索引行,如下:
但是,我们可以在导入过程中通过将index_col
参数设置为某一列可以直接指定索引列。
2. 使用现有的 DataFrame 设置索引
当然,如果已经读取数据或做完一些数据处理步骤后,我们可以通过set_index
手动设置索引。
3. 一些操作后重置索引
4. 将索引从 groupby 操作转换为列
5.排序后重置索引
6.删除重复后重置索引
7. 索引的直接赋值
8.写入CSV文件时忽略索引
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。