本文实例讲述了Python实现多条件筛选目标数据功能。分享给大家供大家参考,具体如下:
python中提供了一些数据过滤功能,可以使用内建函数,也可以使用循环语句来判断,或者使用pandas库,当然在有些情况下使用pandas是为了提高工作效率。举例如下:
1
2
|
a = [( 'chic' , 'JJ' ), ( 'although' , 'IN' ), ( 'menu' , 'JJ' ), ( 'items' , 'NNS' ), ( 'doesnt' , 'JJ' ), ( 'scream' , 'NN' ), ( 'french' , 'JJ' ), ( 'cuisine' , 'NN' )] |
这里的a为一个list,列表中还有元组。每一个元组由单词和其词性组成,我们要筛选词性为JJ何NN的单词。可以有三种写法:
第一种,使用内建函数filter:
1
2
3
4
5
6
7
8
9
|
# -*- coding:utf-8 -*- #!python3 a = [( 'chic' , 'JJ' ), ( 'although' , 'IN' ), ( 'menu' , 'JJ' ), ( 'items' , 'NNS' ), ( 'doesnt' , 'JJ' ), ( 'scream' , 'NN' ), ( 'french' , 'JJ' ), ( 'cuisine' , 'NN' )] def filt_nn(data_text): nn_data = filter ( lambda x: x[ 1 ] = = 'NN' or x[ 1 ] = = 'JJ' , data_text) # print(list(nn_data)) return list (nn_data) print (filt_nn(a)) |
运行结果:
[('chic', 'JJ'), ('menu', 'JJ'), ('doesnt', 'JJ'), ('scream', 'NN'), ('french', 'JJ'), ('cuisine', 'NN')]
第二种,使用pandas包:
1
2
3
4
5
6
7
|
# -*- coding:utf-8 -*- #!python3 import pandas as pd a = [( 'chic' , 'JJ' ), ( 'although' , 'IN' ), ( 'menu' , 'JJ' ), ( 'items' , 'NNS' ), ( 'doesnt' , 'JJ' ), ( 'scream' , 'NN' ), ( 'french' , 'JJ' ), ( 'cuisine' , 'NN' )] data = pd.DataFrame(a, columns = [ 'word' , 'ps' ]) print (data[data.ps.isin([ 'JJ' , 'NN' ])].word) |
运行结果:
0 chic
2 menu
4 doesnt
5 scream
6 french
7 cuisine
Name: word, dtype: object
第三种,使用循环:
1
2
3
4
5
6
7
8
9
|
# -*- coding:utf-8 -*- #!python3 a = [( 'chic' , 'JJ' ), ( 'although' , 'IN' ), ( 'menu' , 'JJ' ), ( 'items' , 'NNS' ), ( 'doesnt' , 'JJ' ), ( 'scream' , 'NN' ), ( 'french' , 'JJ' ), ( 'cuisine' , 'NN' )] absd = [] for i in a: if i[ 1 ] = = 'NN' or i[ 1 ] = = 'JJ' : absd.append(i[ 0 ]) print (absd) |
得到的结果都相同,如下:
['chic', 'menu', 'doesnt', 'scream', 'french', 'cuisine']
虽然结果相同,但是推荐第一、二种方法,因为这两个方法速度更快。
希望本文所述对大家Python程序设计有所帮助。
原文链接:https://blog.csdn.net/layman2016/article/details/79538760