这个问题源于在训练机器学习的一个模型时,使用训练数据时提示prepare的数据中存在np.nan
报错信息如下:
1
|
ValueError: np.nan is an invalid document, expected byte or unicode string. |
刚开始不知道为什么会有这个,后来发现是list中存在nan值
下面是找到nan值的方法:
简单找到:
1
2
3
4
5
6
7
8
|
import numpy as np x = np.array([ 2 , 3 ,np.nan, 5 , np.nan, 5 , 2 , 3 ]) for item in x: if np.isnan(item): print ( 'yes' ) |
拿到index数组:
1
2
3
4
|
x = np.array([[ 1 , 2 , 3 , 4 ], [ 2 , 3 ,np.nan, 5 ], [np.nan, 5 , 2 , 3 ]]) print (np.argwhere(np.isnan(x))) |
1
2
3
|
output: array([[ 1 , 2 ], [ 2 , 0 ]]) |
然而实际上,有些时候,如果是用pandas读出的数据,在list中print时提示为nan,但用isnan方法却并不能正确判断,会提示TypeError,此时需要用pandas.isnull()判断该值是否为空
下面是numpy.isnan()的文档
以上这篇Python Numpy:找到list中的np.nan值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/ninnyyan/article/details/80564699