python3读取python2打包的npy文件会报错,原因是编码方式不同,所以只要在读取的时候加上编码方式即可。
解决方法
1
2
|
docs_train = np.load( './data/20news_clean/train.txt.npy' , allow_pickle = True , encoding = 'bytes' ) docs_test = np.load( './data/20news_clean/test.txt.npy' , allow_pickle = True , encoding = 'bytes' ) |
路径中的文件是python2打包的。
补充:在Python 3中加载Python 2 .npy文件时出错
我有.npy文件,它们是使用Python 2.7.9和Numpy版本1.11.3通过命令创建的np.save('filename')。这些文件是在外部计算机上生成的,该外部计算机是我们研究所的linux集群的一部分。
我将文件复制到本地计算机上,以便通过导入它们np.load('filename.npy')。在我的本地计算机上,我正在运行带有Jupyter-Notebook的Python 3.5.2和Numpy版本1.13.0。
本地操作系统是Ubuntu 16.04.2。
当我尝试在本地加载文件时,出现错误:
1
|
ValueError: invalid literal for int () with base 16 |
浏览了一些Stackoverflow问题后,我尝试使用以下方式指定编码:
1
|
np.load( 'filename.npy' ,encoding = 'latin1' ) |
这给出了相同的错误。encoding='bytes'产量:
1
|
TypeError: can 't multiply sequence by non-int of type ' float ' |
这是Traceback的较大片段:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
|
/ usr / local / lib / python3. 5 / dist - packages / numpy / lib / npyio.py in load( file , mmap_mode, allow_pickle, fix_imports, encoding) 417 else : 418 return format .read_array(fid, allow_pickle = allow_pickle, - - > 419 pickle_kwargs = pickle_kwargs) 420 else : 421 # Try a pickle / usr / local / lib / python3. 5 / dist - packages / numpy / lib / format .py in read_array(fp, allow_pickle, pickle_kwargs) 638 pickle_kwargs = {} 639 try : - - > 640 array = pickle.load(fp, * * pickle_kwargs) 641 except UnicodeError as err: 642 if sys.version_info[ 0 ] > = 3 : / usr / local / lib / python3. 5 / dist - packages / sympy / core / numbers.py in __new__( cls , num, prec) 823 else : 824 _mpf_ = mpmath.mpf( - - > 825 S.NegativeOne * * num[ 0 ] * num[ 1 ] * 2 * * num[ 2 ])._mpf_ 826 elif isinstance (num, Float ): 827 _mpf_ = num._mpf_ TypeError: can 't multiply sequence by non-int of type ' float ' |
我猜想在Python和Numpy版本之间的转换时,编码有问题。关于如何导入文件的任何想法?
解决方案
如中所示,*。npy中数据的存储方式是什么?,.npy文件为字节码,如果您在十六进制编辑器中打开一个字节码,则会看到该文件。
Python 2字节码.pyc,.pyo文件无法在Python 3中运行,因为虚拟机和编译器内部版本已随主要版本更改。
同样,NumPy的C内部结构和字节码编译器在Python 3中也发生了变化,从而破坏了向后兼容性。(这是有意的,因为字节码并不是要持续那么长时间,或者不能与所创建的版本一起使用。)
这些变更的组成意味着,如果不对Python 3的字节码解释器和Python 3的NumPy进行大的更改,和/或从Python 2 NumPy字节码到Python 3的转译器,则无法使用这些Python 2 .npy文件。 Python 3。
正如我之前提到的,这有点像X / Y问题。您不应该依赖.npy文件在各个版本之间工作,因为不能保证它们会保持一致,因为它们本质上是易失性格式(例如Python VM字节码)。
与其对字节码进行逆向工程以对其进行调试,不如尝试获取生成这些文件的源。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持服务器之家。如有错误或未考虑完全的地方,望不吝赐教。
原文链接:https://blog.csdn.net/mch2869253130/article/details/103956926