python作为脚本性语言,加上它的简便易用性。会经常当作脚本用来处理一下数据和格式。其中处理文件就是频繁用处之一。简单编写几个常用的xls和txt读写函数,以后可以快速复用。
用到xlrd库函数需要预先install
命令:pip install xlrd
直接贴源码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
|
#! /usr/bin/python # coding:utf-8 import json import xlrd import sys reload (sys) sys.setdefaultencoding( 'utf-8' ) class ObjectFileReadAndWrite( object ): @classmethod def readXlsToDict( cls , xlsFile): ''' 读取xls文件生成dict ''' data = xlrd.open_workbook(xlsFile) table = data.sheet_by_index( 0 ) ret = [] keys = table.row_values( 0 ) for rowNum in range (table.nrows): oneRowValues = table.row_values(rowNum) if rowNum > 0 : d = {} for colIdx, key in enumerate (keys): d[key] = oneRowValues[colIdx] ret.append(d) return ret @classmethod def readXlsToList( cls , xlsFile): ''' 读取xls文件生成list ''' data = xlrd.open_workbook(xlsFile) table = data.sheet_by_index( 0 ) ret = [] for rowNum in range (table.nrows): oneRowValues = table.row_values(rowNum) ret.append(oneRowValues) return ret @classmethod def readTxt( cls , txtFile, sep): ''' 读取txt文件 ''' # with + open 可保证with语句执行完毕后同时关闭打开的文件句柄。 ret = [] with open (txtFile, "r" ) as f: for line in f.readlines(): line = line.strip( '\n' ) # 去掉换行符 listInfo = line.split(sep) # 以 sep 分割成数组 if listInfo: ret.append(listInfo) return ret @classmethod def writeToJson( cls , jsonFile, ret): ''' 写入json文件 ''' with open (jsonFile, 'w' ) as fp: json.dump(ret, fp, indent = 2 , sort_keys = True , encoding = "utf-8" , ensure_ascii = False ) @classmethod def writeFromStr( cls , filePath, s): ''' string写入文件 ''' with open (filePath, 'w' ) as fp: fp.write(s) @classmethod def writeFromList( cls , filePath, wList): ''' list写入文件 ''' with open (filePath, 'w' ) as fp: fp.writelines(wList) if __name__ = = "__main__" : obj = ObjectFileReadAndWrite() # xls ret = obj.readXlsToDict(xlsFile = 'xxx.xls' ) obj.writeToJson( 'xxx.json' , ret) # txt ret2 = obj.readTxt(txtFile = 'result.txt' , sep = " " ) obj.writeToJson( 'result.json' , ret2) |
因文件中有中文,中间遇到中文乱码问题
1
2
3
4
5
6
|
import sys reload (sys) sys.setdefaultencoding( 'utf-8' ) # encoding="utf-8", ensure_ascii=False |
1、这个是由于Unicode编码与ASCII编码的不兼容造成的。
2、通常都是ascii,由此Python自然调用ascii编码解码程序去处理字符流,当字符流不属于ascii范围内,就会抛出异常(ordinal not in range(128))
百度了下通过 以上方式 解决了。
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/heshushun/article/details/114001317