您所在的位置：一氧化碳中毒 >> 病因探究>> >> pandas操作excel全总结

pandas操作excel全总结

文章来源：一氧化碳中毒发布时间:2021-6-15 17:05:46 点击数：次

　　刘文斌治疗白癜风怎么样 https://m-mip.39.net/nk/mipso_8498651.html

pandas是基于Numpy创建的Python包，内置了大量标准函数，能够高效地解决数据分析数据处理和分析任务，pandas支持多种文件的操作，比如Excel，csv，json，txt文件等，读取文件之后，就可以对数据进行各种清洗、分析操作了。

首先，了解下pandas中两个主要的数据结构，一个是Series，另一个是DataFrame。

Series一种增强的一维数组，类似于列表，由索引（index）和值（values）组成。

DataFrame是一个类似表格的二维数据结构，索引包括列索引和行索引，每列可以是不同的值类型（数值、字符串、布尔值等）。DataFrame的每一行和每一列都是一个Series。

pandas读取excel

pandas读取文件之后，将内容存储为DataFrame，然后就可以调用内置的各种函数进行分析处理。

pandas对xlrd等模块进行了封装，可以很方便的处理excel文件，支持xls和xlsx等格式，需要提前安装模块pipinstallxlrd

pandas.read_excel(filename,sep,header,encoding)

「参数解释」

filename：文件路径，可以设置为绝对路径或相对路径sep：分隔符，常用的有逗号,分隔、\t分隔，默认逗号分隔，read_table默认是\t(也就是tab)切割数据集的header：指定表头，即列名，默认第一行，header=None,没有表头，全部为数据内容encoding：文件编码方式，不设置此选项，Pandas默认使用UTF-8来解码。index_col，指定索引对应的列为数据框的行标签，默认Pandas会从0、1、2、3做自然排序分配给各条记录。通过names=[a,b,c]可以自己设置列标题

importpandasaspdresult=pd.read_excel(test1.xlsx)print(result)

#指定第一列为行索引result=pd.read_excel(test1.xlsx,index_col=0)print(result)

#默认读取第一个sheet，读取第2个sheet如下result=pd.read_excel(test1.xlsx,sheet_name=1)print(result)

result=pd.read_excel(test1.xlsx,names=[序号,姓名,年龄,城市])print(result)

#查看指定前几行，默认前5行，指定行数写小括号里print(result.head())#查看数据的（行数、列数）print(result.shape)#(4,4)#查看列索引列表print(result.columns.values)#[NoNameAgeAddress]#查看行索引列表print(result.index.values)#[]新建excel并写入数据

importpandasaspdresult=pd.DataFrame({序号:[1,2,3],姓名:[张三,李四,王五]})result.to_excel(新建.xlsx)pandas增删改查：

读取下面的表格数据，进行学习：

importpandasaspddf=pd.read_excel(test1.xlsx,index_col=No)print(df)

增删改查的常用方法，已整理成思维导图，便于大家查阅学习：

「两种查询方法的介绍」

「loc」根据行，列的标签值查询

「iloc」通过行号索引行数据，行号从0开始，逐次加1。

「注意」当使用显式索引（即data[a:c]）作切片时，结果「包含」最后一个索引；而当使用隐式索引（即data[0:2]）作切片时，结果「不包含」最后一个索引。

loc属性，表示取值和切片都是显式索引

iloc属性，表示取值和切片都是隐式索引

Pandas读取csv文件的语法格式和读取excel文件是相似的，大家可以对照读取excel的方法学习。

使用pandas表格数据常用的清洗方法：

df.drop([Name],axis=1)#删除列df1.drop(labels=[1,3],axis=0)#删除行df.drop([0,1])#删除行df.drop_duplicates()#删除重复值df.fillna(missing)#使用字符串填补df.replace(old,new)#old替换成newdf.rename(columns={old_name:new_name})#选择性更改列名df.columns=[a,b,c]#重命名列名df.dropna(axis=0)#删除有缺失的行df.dropna(axis=1)#删除有缺失的列

当然了，pandas除了读取csv和excel文件之外，读写数据的方法还有很多种，感兴趣的话，大家可以根据官方文档学习。

转载请注明：http://www.lwblm.com/bytj/12003.html

上一篇文章： prometheus集成alertman

下一篇文章： python3基本数据类型总结全教程

自助服务

热点文章

最近更新