python提供了大量的库,可以非常方便的进行各种操作,现在把python中实现读写csv文件的方法使用程序的方式呈现出来。
在编写python程序的时候需要csv模块或者pandas模块,其中csv模块使不需要重新下载安装的,pandas模块需要按照对应的
python版本安装。
在python2环境下安装pandas的方式是:
1
|
sudo pip install pandas |
在python3环境下安装pandas的方式是:
1
|
sudo pip3 install pandas |
1、使用csv读写csv文件方法总结
读文件的时候,打开文件,调用csv.reader()读取文件;对于读取之后的文件的内容,要把这些内容输入到另一个文件中保存,可以通过遍历读取的文件的每一行,然后使用csv_write.writerow()的方式写入到指定的文件。
2、使用csv读写csv文件示例代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
#encoding:utf-8 import csv #读取csv文件 csv_file = csv.reader( open ( '../../data/capital/2010-Q4-cabi-trip-history-data.csv' )) print (csv_file) #添加newline可以避免一行之后的空格,这样需要在python3环境下运行 out = open ( '../../data/capital/2010-Q4' , 'a' ,newline = '') csv_write = csv.writer(out,dialect = 'excel' ) for item in csv_file: #print item csv_write.writerow(item) print ( "write over" ) |
上面的代码是传统的打开文件---读取文件---打开文件---关闭文件的方式进行文件读取和写入。在读取和写入的过程中分别调用了csv库的reader()和writer()
3、使用csv读写csv文件示例代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
#encoding:utf-8 import csv #下面这种加了encoding的写法需要在python3环境下运行 csv_reader = csv.reader( open ( '../../data/capital/2011-Q1-cabi-trip-history-data.csv' ,encoding = 'utf-8' )) out = open ( '../../data/capital/a0' , 'w' ,newline = '') csv_writer = csv.writer(out,dialect = 'excel' ) for row in csv_reader: #输出的每一行是一个list,list中的每一个元素转换成了string类型 print (row) csv_writer.writerow(row) |
示例代码2的读写方式与示例代码1的方式基本相同,不同的是在示例代码2中打开文件的时候指定了打开时的编码方式,对于输出文件的打开方式也与示例代码1的方式有少量的差别,把写入方式右'a'改成了'w
4、使用csv读写csv文件示例代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
|
#encoding:utf-8 import csv #读取csv文件方式1 csvFile = open ( '../../data/capital/2011-Q3-cabi-trip-history-data.csv' , 'r' ) reader = csv.reader(csvFile) data = [] for item in reader: # print(item) data.append(item) #print(data) csvFile.close() #读取csv文件方式2 with open ( "../../data/capital/2011-Q3-cabi-trip-history-data.csv" , 'r' ) as csvFile: #读取csv文件,返回的是迭代类型 reader2 = csv.reader(csvFile) for item2 in reader2: print (item2) csvFile.close() #从列表写入csv文件 #设置newline,否则两行之间会空一行 csvFile2 = open ( '../../data/capital/0001.csv' , 'w' ,newline = '') writer = csv.writer(csvFile2) m = len (data) for i in range (m): writer.writerow(data[i]) csvFile2.close() #从字典写入csv文件 dic = { '张三' : 123 , '李四' : 456 , '王二娃' : 789 } csvFile3 = open ( '../../data/capital/0001.csv' , 'w' ,newline = '') writer2 = csv.writer(csvFile3) for key in dic: print (key) # writer2.writerow([key,dic[key]]) csvFile3.close() |
在上面的代码中提出了两种不同的打开csv文件和写入csv文件的方式。其中第一种打开方式与前面两种非常相似,不同之处是在这种方式中,打开文件的时候加入了读取方式,而前面两个示例代码没有加。另一种读取方式是采用python中独有的命名方式对打开文件命名,其他部分相似。在这个示例中,对列表和字典写入csv文件做了区分,分别提供了列表和字典写入csv文件的示例代码。
5、使用csv读写csv文件示例代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
|
#encoding:utf-8 ''' import pandas as pd #任意的多组列表 a = [1,2,3] b = [4,5,6] #字典中的key值即为csv中的列名 dataFrame = pd.DataFrame({'a_name':a,'b_name':b}) #将DataFrame存储为csv,index表示是否显示行名,default=True dataFrame.to_csv('0001.csv',index=False,sep='') #pandas提供的读取csv的方法 data = pd.read_csv('test.csv') ''' #=================================== #另一种方法:用csv包,一行一行写入 import csv #python2可以用file替代open with open ( 'test.csv' , 'w' ) as csvFile: writer = csv.writer(csvFile) #先写columns_name writer.writerow([ "index" , "a_name" , "b_name" ]) #写入多行用writerows writer.writerows([[ 1 , 2 , 3 ],[ 0 , 1 , 2 ],[ 4 , 5 , 6 ]]) #用reder读取csv文件 with open ( 'test.csv' , 'r' ) as csvFile: reader = csv.reader(csvFile) for line in reader: print line |
这个示例代码提出了写入一行和写入多行的实现方式。
6、使用csv读写csv文件示例代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
|
#encoding:utf-8 import csv with open ( 'test.csv' ) as csvFile: #readcsv = csv.reader(csvFile,delimiter='') readcsv = csv.reader(csvFile) # rows = [row for row in readcsv] for row in readcsv: rows = [row for row in reader] #print(row)#打印一行 print (row[ 0 ]) #打印一行中的某个cell print (row[ 0 ],row[ 1 ]) #打印一行中的某个cell print ( '=================' ) with open ( 'test.csv' ) as csvFile: readCSV = csv.reader(csvFile) cols1 = [] cols2 = [] cols3 = [] for row in readCSV: col1 = row[ 0 ] col2 = row[ 1 ] col3 = row[ 2 ] cols1.append(col1) cols2.append(col2) cols3.append(col3) print cols1 print cols2 print cols3 |
上面的代码示例提出了读取所有行的新写法,提出了读取某个cell和某一列的方式。
7、使用csv读写csv文件示例代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
|
#encoding:utf-8 import csv #第一种方法:使用reader函数,接收一个可迭代的对象(比如csv文件),能返回一个生成器,就可以从其中解析出csv的内容.eg:下面的代码可以读取csv的全部内容,以行为单位 with open ( 'test.csv' , 'rb' ) as csvFile: reader = csv.reader(csvFile) rows = [row for row in reader] print rows print ( '===========' ) #提取其中某一列可以使用下面的方法 with open ( 'test.csv' , 'rb' ) as csvFile: reader = csv.reader(csvFile) column = [row[ 1 ] for row in reader] print column print ( '======第二种方法======' ) #第二种方法:使用DictReader,和reader函数类似,接收可迭代的对象,能返回一个可迭代的对象,能返回一个生成器,但是返回的每一个单元格都放在一个字典的值内,而这个字典的键则是这个单元格的标题.用下面的代码可以看到DictReader的结构: with open ( 'test.csv' , 'rb' ) as csvFile: reader = csv.DictReader(csvFile) column = [row for row in reader] print (column) #使用CictReader读取csv的某一列,这样可以按照列的标题查询 with open ( 'test.csv' , 'rb' ) as csvFile: reader = csv.DictReader(csvFile) column = [row[ 'a_name' ] for row in reader] print column |
上面的代码提出了读取整行和整列的新方式。另外提出了一种使用DictReader的方式按照列名读取的方式。
8、使用csv读写csv文件示例代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
|
#encoding:utf-8 import csv with open ( 'test.csv' , 'rb' ) as csvFile: reader = csv.reader(csvFile) for row in reader: print row #向csv文件中写内容,这样写会把内容全部写到一个cell中 with open ( 'test1.csv' , 'wb' ) as csvFile: writer = csv.writer(csvFile,delimiter = ' ' ,quotechar = '|' ,quoting = csv.QUOTE_MINIMAL) writer.writerow([ 'a' , '4' , '5' , '6' ]) writer.writerow([ 'b' , '1' , '2' , '3' ]) writer.writerow([ 'c' , '9' , '8' , '7' ]) writer.writerow([ 'd' , '8' , '3' , '1' ]) #向csv文件中写内容,下面的写法最终可以把每一列的内容放在一个cell中 with open ( 'test2.csv' , 'wb' ) as csvFile: writer = csv.writer(csvFile,dialect = 'excel' ) writer.writerow([ 'a' , '4' , '5' , '6' ]) writer.writerow([ 'b' , '1' , '2' , '3' ]) writer.writerow([ 'c' , '9' , '8' , '7' ]) writer.writerow([ 'd' , '8' , '3' , '1' ]) |
上面的代码提出了可以把列表中的数据放入到不同cell的实现方式。