代码实例
python-magic是libmagic文件类型识别库的python接口。 libmagic通过根据预定义的文件类型列表检查它们的头文件来识别文件类型。 这个功能通过Unix命令文件暴露给命令行。
1
2
3
4
5
6
7
|
>>> import magic >>> magic.from_file( "testdata/test.pdf" ) 'PDF document, version 1.2' >>> magic.from_buffer( open ( "testdata/test.pdf" ).read( 1024 )) 'PDF document, version 1.2' >>> magic.from_file( "testdata/test.pdf" , mime = True ) 'application/pdf' |
还有一个Magic类提供更直接的控制,包括覆盖魔术数据库文件并开启字符编码检测。 这不建议用于一般用途。 特别是,跨多个线程共享并不安全,如果尝试这样做会失败。
1
2
3
4
|
>>> f = magic.Magic(uncompress = True ) >>> f.from_file( 'testdata/test.gz' ) 'ASCII text (gzip compressed data, was "test" , last modified: Sat Jun 28 21 : 32 : 52 2008 , from Unix)' |
还可以结合标志选项:
1
2
3
|
>>> f = magic.Magic(mime = True , uncompress = True ) >>> f.from_file( 'testdata/test.gz' ) 'text/plain' |
以上这篇python使用magic模块进行文件类型识别方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持服务器之家。
原文链接:https://blog.csdn.net/diyiday/article/details/80571179