本文介绍: 列索引字符串one’,‘two’,‘three’;2)列索引名设为 [‘flymiles’,‘videogame’,‘icecream’,’type‘];1)生成数据使用numpyarange()函数reshape()函数;为data1添加一数据,列索引为‘four’,值都为10;4)显示所有’type’为’largeDoses‘的数据筛选第1列中大于2的所有行数据,另存为data1对象查询列索引为‘two’和‘three两列数据查询第0行、第2行、第0列、第2列数据

一. 简答题(共2题,100分)

  1. (简答题, 50分)
  2. 创建访问DataFrame对象

创建3×3DataFrame数据对象:数据内容为1-9;行索引为字符a,bc;列索引为字符串one’,‘two’,‘three’;

查询列索引为‘two’和‘three两列数据;

查询第0行、第2行、第0列、第2列数据;

筛选第1列中大于2的所有行数据,另存为data1对象

data1添加一列数据,列索引为‘four’,值都为10;

data1所有值大于9的数据修改为8;

删除data1中第0行和第1行数据。

提示

1)生成数据,使用numpy的arange()函数和reshape()函数;

2)使用 data>9生成布尔型的DataFrame用于整个DataFrame的数据过滤

import pandas as pd
import numpy as np
from pandas import Series,DataFrame
data = DataFrame(np.arange(1,10).reshape(3,3),index = ['a','b','c'],columns = ['one','two','three']) #(1
print(data.loc[:,['two','three']]) #(2
print(data.iloc[[0,2],:]) #(3
print(data.iloc[:,[0,2]]) #(4
data1 = data.loc[data.iloc[:,1] > 2]
print(data1) #(5
data1.loc[:,'four'] = 10
print(data1) #(6
data1[data1>9]=8
print(data1) #(7
print(data1.drop(data1.index[0:2],axis = 0)) #(8
  1. (简答题, 50分)
    海伦一直使用在线交友网站寻找适合的约会对象, 她将交友数据存放在datingTestSet.xls文件中。

    1)从文件读取有效数据保存到Dataframe对象中,跳过所有文字解释行;

    2)列索引名设为 [‘flymiles’,‘videogame’,‘icecream’,’type‘];

    3)显示读取到的前5条数据;

    4)显示所有’type’为’largeDoses‘的数据;

    5)将平均每周玩视频游戏时间超过10的数据都改成10;

    6)将修改后的DataFrame对象保存文件中,保留行、列索引。

datingTestSet.csv`

import numpy as np
import pandas as pd
from pandas import Series,DataFrame
dT = pd.read_csv('C:\python\datingTestSet.csv',header=None,names=['flymiles','videogame','icecream','type'],skiprows=2) #(1 (2
print(dT[:5]) #(3
print(dT[dT['type'] == 'largeDoses']) #(4
mask = dT['videogame'] > 10
dT.loc[mask,'videogame'] = 10 #(5
print(dT)
dT.to_csv('C:\python\datingTestSet.csv',mode='w') #(6

原文地址:https://blog.csdn.net/qq_60462402/article/details/127245650

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_37442.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注