用扩展名判断文件格式非常简单,但是有可能是错误的。 jpeg文件有固定的文件头,其文件头的格式如下:
1
2
3
|
start marker | jfif marker | header length | identifier 0xff , 0xd8 | 0xff , 0xe0 | 2 - bytes | "jfif\0" |
所以可以通过文件头的方式快速判断文件格式:
1
2
3
4
5
6
7
|
def is_jpg(filename): data = open (filename, 'rb' ).read( 11 ) if data[: 4 ] ! = '\xff\xd8\xff\xe0' and data[: 4 ]! = '\xff\xd8\xff\xe1' : return false if data[ 6 :] ! = 'jfif\0' and data[ 6 :] ! = 'exif\0' : return false return true |
也可以通过pil类库来做判断:
1
2
3
4
5
6
7
|
from pil import image def is_jpg(filename): try : i = image. open (filename) return i. format = = 'jpeg' except ioerror: return fals |
应用场景:判断image文件夹中的jpeg文件是否完整,代码如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
|
#coding=utf-8 #summary: 判断图片的有效性 import io import os from pil import image #判断文件是否为有效(完整)的图片 #输入参数为文件路径 #会出现漏检的情况 def isvalidimage(pathfile): bvalid = true try : image. open (pathfile).verify() except : bvalid = false return bvalid def is_valid_jpg(jpg_file): """判断jpg文件下载是否完整 """ if jpg_file.split( '.' )[ - 1 ].lower() = = 'jpg' : with open (jpg_file, 'rb' ) as f: f.seek( - 2 , 2 ) return f.read() = = '\xff\xd9' #判定jpg是否包含结束字段 else : return true #利用pil库进行jpeg格式判定,但有些没有结束字段的文件检测不出来 def is_jpg(filename): try : i = image. open (filename) return i. format = = 'jpeg' except ioerror: return false allfiles = os.listdir( 'image' ) log_file = open ( 'img_lossinfo.txt' , 'w' ) log = open ( 'img_r.txt' , 'w' ) log_w = open ( 'img_w.txt' , 'w' ) log1 = open ( 'img_jpeg.txt' , 'w' ) log2 = open ( 'img_notjpg.txt' , 'w' ) for i in allfiles: #if 1: if i[ - 4 :] = = '.jpg' : f = os.path.join( 'image' ,i) value = isvalidimage(f) if not value: log_file.write(i + '\n' ) if is_valid_jpg(f): print f log.write(i + '\n' ) else : log_w.write(i + '\n' ) if is_jpg(f): log1.write(i + '\n' ) else : log2.write(i + '\n' ) |
以上这篇使用python判断jpeg图片的完整性实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/qiyuanxiong/article/details/77943578