pandas读取Excel
1
2
3
|
import pandas as pd # 参数1:文件路径,参数2:sheet名 pf = pd.read_excel(path, sheet_name = 'sheet1' ) |
删除指定列
1
2
|
# 通过列名删除指定列 pf.drop([ '序号' , '替代' , '签名' ], axis = 1 , inplace = True ) |
替换列名
1
2
3
4
5
6
7
8
9
10
11
12
13
|
# 旧列名 新列名对照 columns_map = { '列名1' : 'newname_1' , '列名2' : 'newname_2' , '列名3' : 'newname_3' , '列名4' : 'newname_4' , '列名5' : 'newname_5' , # 没有列名的情况 'Unnamed: 10' : 'newname_6' , } new_fields = list (columns_map.values()) pf.rename(columns = columns_map, inplace = True ) pf = pf[new_fields] |
替换 Nan
通常使用
1
|
pf.fillna( '新值' ) |
替换表格中的空值,(Nan)。
但是,你可能会发现 fillna() 会有不好使的时候,记得加上 inplace=True
1
2
|
# 加上 inplace=True 表示修改原对象 pf.fillna( '新值' , inplace = True ) |
官方对 inplace 的解释
inplace : boolean, default False
If True, fill in place. Note: this will modify any other views on this object, (e.g. a no-copy slice for a column in a DataFrame).
全列输出不隐藏
你可能会发现,输出表格的时候会出现隐藏中间列的情况,只输出首列和尾列,中间用 … 替代。
加上下面的这句话,再打印的话,就会全列打印。
1
2
|
pd.set_option( 'display.max_columns' , None ) print (pf) |
将Excel转换为字典
1
|
pf_dict = pf.to_dict(orient = 'records' ) |
全部代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
|
import pandas as pd pf = pd.read_excel(path, sheet_name = 'sheet1' ) columns_map = { '列名1' : 'newname_1' , '列名2' : 'newname_2' , '列名3' : 'newname_3' , '列名4' : 'newname_4' , '列名5' : 'newname_5' , # 没有列名的情况 'Unnamed: 10' : 'newname_6' , } new_fields = list (columns_map.values()) pf.drop([ '序号' , '替代' , '签名' ], axis = 1 , inplace = True ) pf.rename(columns = columns_map, inplace = True ) pf = pf[new_fields] pf.fillna( 'Unknown' , inplace = True ) # pd.set_option('display.max_columns', None) # print(smt) pf_dict = pf.to_dict(orient = 'records' ) |
补充:python pandas replace 0替换成nan,bfill/ffill
0替换成nan
一般情况下,0 替换成nan会写成
1
|
df.replace( 0 , None , inplace = True ) |
然而替换不了,应该是这样的
1
|
df.replace( 0 , np.nan, inplace = True ) |
nan替换成前值后值
1
2
|
df.ffill(axis = 0 ) # 用前一个值替换 df.bfill(axis = 0 ) # 用后一个值替换 |
以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。如有错误或未考虑完全的地方,望不吝赐教。
原文链接:https://blog.csdn.net/qq_36963372/article/details/85779930