创建pandas容器主要包括两部分内容,分别时创建空的DataFrame和对DataFrame添加内容。
注意:创建一个空的DataFrame并在循环中不断将有数据的DataFrame concat或者append在它后面,最终生成一个目标DataFrame的方法并不好,效率低,内存消耗大。正确的方法是新建一个list,将DataFrame 添加入列表,最终一次性concat。如果追求效率,甚至要避免DataFrame作为中间过程存储容器,而是改用dict等更高效的方法。
一、创建空DataFrame
对于以df=pd.DataFrame()形式创建的空表,由于index和Columns的缺失会面临一系列问题。
用iloc会报错 “iloc cannot enlarge its target object”
二、创建pandas容器
1、先创建空的dataframe,然后对各列赋值,使用于大量数据情况下,效率较高。但是需要注意行号的变化。
2、先创建空DataFrame,然后使用字典作为中间变量存储生成的中间值,然后把字典转换为Series合并到DataFrame。该方法可以避免繁琐的dataframe下标计算,但是效率较低。
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。