本文介绍: 1、numpy已经能够帮助我们处理数据,能够结合matplotlib解决部分数据展示等问题,那么pandas用在什么地方。1、2008年Wes McKinney(韦斯·麦金尼)开发出的库。3、以numpy为基础,借力numpy模块在计算方面性能高的优势。4、封装了matplotlib、numpy的画图和计算。4、基于matplotlib能够简便的画图。2、专门用于数据分析的开源python库。1、pandas三大数据结构。1、DataFrame结构。2、如何创建更有意义的数据。2、便捷的数据处理能力。

一、pandas介绍

1、2008年Wes McKinney(韦斯·麦金尼)开发出的库

2、专门用于数据分析的开源python库

3、以numpy为基础,借力numpy模块在计算方面性能高的优势

4、基于matplotlib能够简便的画图

5、独特的数据结构

6、也是三个单词组合而成:panel + data + analysis
面板数据 – 来源于计量经济学,通常用来存储三维的数据

二、为什么使用pandas

1、numpy已经能够帮助我们处理数据,能够结合matplotlib解决部分数据展示等问题,那么pandas用在什么地方

2、便捷的数据处理能力

3、读取文件方便

4、封装了matplotlib、numpy的画图和计算

三、核心数据结构

1、pandas三大数据结构
DataFrame、Panel、Series

四、DataFrame

1、DataFrame结构
既有行索引,又有列索引的二维数组

2、如何创建更有意义的数据

import numpy as np
# 创建一个符合正态分布的10个股票5天的涨跌幅数据
stock_change = np.random.normal(0, 1, (10, 5))

stock_change

import pandas as pd
# 加上行列索引
pd.DataFrame(stock_change)

# 添加行索引
stock = ["股票%s" %str(i) for i in range (10)]

pd.DataFrame(stock_change, index=stock)

# 添加列索引
data = pd.date_range(start="20180101", periods=5, freq="B")

data

pd.DataFrame(stock_change, index=stock, columns=data)

3、DataFrame对象既有行索引,又有列索引
行索引:表明不同行,横向索引,叫index
列索引:表明不同列,纵向索引,叫columns

4、DataFrame的属性
常用属性:
(1)shape
(2)index:DataFrame的行索引列表
(3)columns:DataFrame的列索引列表
(4)values:直接获取其中array的值(排除行索引列索引后的值,就是ndarray)
(5)T:行列的转置

常用方法:
head():前几行
tail():后几行

原文地址:https://blog.csdn.net/csj50/article/details/135468627

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

如若转载,请注明出处:http://www.7code.cn/show_53288.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱:suwngjj01@126.com进行投诉反馈,一经查实,立即删除!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注