本文实例讲述了Python简单检测文本类型的方法。分享给大家供大家参考,具体如下:
1、根据文件头。
1
2
3
4
5
|
#是否为带BOM头的UTF8文件 def IsUtf8BomFile(pathfile): if b '\xef\xbb\xbf' = = open (pathfile, mode = 'rb' ).read( 3 )): return True return False |
2、用cchardet库。
1
2
3
|
>>> import cchardet >>> cchardet.detect( open (pathfile, 'rb' ).read()) { 'encoding' : 'UTF-8' , 'confidence' : 0.9900000095367432 } |
希望本文所述对大家Python程序设计有所帮助。