reindex更多的不是修改pandas对象的索引,而只是修改索引的顺序,如果修改的索引不存在就会使用默认的None代替此行。且不会修改原数组,要修改需要使用赋值语句。
series.reindex()
1
2
3
4
|
import pandas as pd import numpy as np obj = pd.Series( range ( 4 ), index = [ 'd' , 'b' , 'a' , 'c' ]) print obj |
1
2
3
4
5
|
d 0 b 1 a 2 c 3 dtype: int64 |
1
2
3
4
5
6
7
8
|
print obj.reindex([ 'a' , 'b' , 'c' , 'd' , 'e' ]) 1 a 2.0 b 1.0 c 3.0 d 0.0 e NaN dtype: float64 |
多出的索引‘e'会被赋值NaN
内插或填充method
1
2
|
obj1 = pd.Series( range ( 3 ), index = [ 'a' , 'c' , 'e' ]) print obj1.reindex([ 'a' , 'b' , 'c' , 'd' , 'e' ],method = 'pad' ) |
1
2
3
4
5
6
|
a 0 b 0 c 1 d 1 e 2 dtype: int64 |
ffill或pad: 前向(或进位)填充
bfill或backfill: 后向(或进位)填充
dataframe.reindex()
dataframe.reindex()可以改变(行)索引,列或两者。当只传入一个序列时,行被重新索引,一次可以对两个重新索引,可是插值只在行侧(0坐标轴)进行
1
2
|
frame = pd.DataFrame(np.arange( 9 ).reshape(( 3 , 3 )), index = [ 'a' , 'c' , 'd' ], columns = [ 'c1' , 'c2' , 'c3' ]) print frame |
1
2
3
4
|
c1 c2 c3 a 0 1 2 c 3 4 5 d 6 7 8 |
1
2
|
states = [ 'c1' , 'b2' , 'c3' ] frame.reindex(columns = states) |
c1 | b2 | c3 | |
---|---|---|---|
a | 0 | NaN | 2 |
c | 3 | NaN | 5 |
d | 6 | NaN | 8 |
列名不一样的会被赋值nan
1
2
|
frame_na = frame.reindex(index = [ 'a' , 'b' , 'c' , 'd' ], method = 'ffill' , columns = states) print frame_na |
1
2
3
4
5
|
c1 b2 c3 a 0 NaN 2 b 0 NaN 2 c 3 NaN 5 d 6 NaN 8 |
插值只在行侧(0坐标轴)进行,但是我们可以在其之后,对nan值进行填充
1
|
frame_na.fillna(method = 'ffill' ,axis = 1 ) |
c1 | b2 | c3 | |
---|---|---|---|
a | 0.0 | 0.0 | 2.0 |
b | 0.0 | 0.0 | 2.0 |
c | 3.0 | 3.0 | 5.0 |
d | 6.0 | 6.0 | 8.0 |
以上这篇python pandas 对series和dataframe的重置索引reindex方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/LY_ysys629/article/details/55005201