本文实例为大家分享了python统计文本中单词出现频率的具体代码,供大家参考,具体内容如下
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
|
#coding=utf-8 import os from collections import counter sumsdata = [] for fname in os.listdir(os.getcwd()): if os.path.isfile(fname) and fname.endswith( '.txt' ): with open (fname, 'r' ) as fp: data = fp.readlines() sumsdata + = [line.strip().lower() for line in data] cnt = counter() for word in sumsdata: cnt[word] + = 1 cnt = dict (cnt) for key,value in cnt.items(): print (key + ":" + str (value)) |
首先在和程序所在路径下创建几个文本文件,我建了两个,文件内容分别为hello python goodbye python 和 i like python。运行程序,得到以下结果
以上所述是小编给大家介绍的python统计文本中单词出现频率详解整合,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对服务器之家网站的支持!
原文链接:https://blog.csdn.net/ls_6468/article/details/78519958