使用场景:需要去除txt文本中的空格、数字、特定字母等。
需要修改的txt文本叫做:train.txt
修改之后保存成:train_output.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
# ecoding=utf-8 ifn = r "train.txt" ofn = r "train_output.txt" infile = open (ifn, 'rb' ) outfile = open (ofn, 'wb' ) for eachline in infile.readlines(): #去掉文本行里面的空格、\t、数字(其他有要去除的也可以放到' \t1234567890'里面) lines = filter ( lambda ch: ch not in ' \t1234567890' , eachline) outfile.write(lines) # 写入train_output.txt(此处是一股脑的全写进去,并没有做任何的分行处理) infile.close outfile.close |
以上这篇python 去除txt文本中的空格、数字、特定字母等方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/lanyuelvyun/article/details/76991067