前言
大家在使用Python进行数据分析时,经常要使用到的一个数据结构就是pandas的DataFrame,关于python中pandas.DataFrame的基本操作,大家可以查看这篇文章。
pandas.DataFrame排除特定行
如果我们想要像Excel的筛选那样,只要其中的一行或某几行,可以使用isin()
方法,将需要的行的值以列表方式传入,还可以传入字典,指定列进行筛选。
但是如果我们只想要所有内容中不包含特定行的内容,却并没有一个isnotin()
方法。我今天的工作就遇到了这样的需求,经常查找之后,发现只能换种方式使用isin()
来实现这个需求。
示例如下:
1
2
3
4
5
6
7
8
9
10
11
12
|
In [ 3 ]: df = pd.DataFrame([[ 'GD' , 'GX' , 'FJ' ], [ 'SD' , 'SX' , 'BJ' ], [ 'HN' , 'HB' ...: , 'AH' ], [ 'HEN' , 'HEN' , 'HLJ' ], [ 'SH' , 'TJ' , 'CQ' ]], columns = [ 'p1' , 'p2 ...: ', ' p3']) In [ 4 ]: df Out[ 4 ]: p1 p2 p3 0 GD GX FJ 1 SD SX BJ 2 HN HB AH 3 HEN HEN HLJ 4 SH TJ CQ |
如果只想要p1为GD和HN的两行,可以这么做:
1
2
3
4
5
|
In [ 8 ]: df[df.p1.isin([ 'GD' , 'HN' ])] Out[ 8 ]: p1 p2 p3 0 GD GX FJ 2 HN HB AH |
但是如果我们想要除了这两行之外的数据,就需要绕点路了。
原理是先把p1取出并转换为列表,然后再从列表中去不需要的行(值)去除,然后再在DataFrame中使用isin()
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
In [ 9 ]: ex_list = list (df.p1) In [ 10 ]: ex_list.remove( 'GD' ) In [ 11 ]: ex_list.remove( 'HN' ) In [ 12 ]: ex_list Out[ 12 ]: [ 'SD' , 'HEN' , 'SH' ] In [ 13 ]: df[df.p1.isin(ex_list)] Out[ 13 ]: p1 p2 p3 1 SD SX BJ 3 HEN HEN HLJ 4 SH TJ CQ |
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者使用python能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对服务器之家的支持。