用程序来处理图像和办公文档经常出现在实际开发中,python的标准库中虽然没有直接支持这些操作的模块,但我们可以通过python生态圈中的第三方模块来完成这些操作。
操作图像
计算机图像相关知识
颜色。如果你有使用颜料画画的经历,那么一定知道混合红、黄、蓝三种颜料可以得到其他的颜色,事实上这三种颜色就是被我们称为美术三原色的东西,它们是不能再分解的基本颜色。在计算机中,我们可以将红、绿、蓝三种色光以不同的比例叠加来组合成其他的颜色,因此这三种颜色就是色光三原色,所以我们通常会将一个颜色表示为一个rgb值或rgba值(其中的a表示alpha通道,它决定了透过这个图像的像素,也就是透明度)。
名称 | rgba值 | 名称 | rgba值 |
---|---|---|---|
white | (255, 255, 255, 255) | red | (255, 0, 0, 255) |
green | (0, 255, 0, 255) | blue | (0, 0, 255, 255) |
gray | (128, 128, 128, 255) | yellow | (255, 255, 0, 255) |
black | (0, 0, 0, 255) | purple | (128, 0, 128, 255) |
像素。对于一个由数字序列表示的图像来说,最小的单位就是图像上单一颜色的小方格,这些小方块都有一个明确的位置和被分配的色彩数值,而这些一小方格的颜色和位置决定了该图像最终呈现出来的样子,它们是不可分割的单位,我们通常称之为像素(pixel)。每一个图像都包含了一定量的像素,这些像素决定图像在屏幕上所呈现的大小。
用pillow操作图像
pillow是由从著名的python图像处理库pil发展出来的一个分支,通过pillow可以实现图像压缩和图像处理等各种操作。可以使用下面的命令来安装pillow。
1
|
pip install pillow |
pillow中最为重要的是image类,读取和处理图像都要通过这个类来完成。
1
2
3
4
5
6
|
>>> from pil import image >>> >>> image = image. open ( './res/guido.jpg' ) >>> image. format , image.size, image.mode ( 'jpeg' , ( 500 , 750 ), 'rgb' ) >>> image.show() |
剪裁图像
1
2
3
|
>>> image = image. open ( './res/guido.jpg' ) >>> rect = 80 , 20 , 310 , 360 >>> image.crop(rect).show() |
生成缩略图
1
2
3
4
|
>>> image = image. open ( './res/guido.jpg' ) >>> size = 128 , 128 >>> image.thumbnail(size) >>> image.show() |
缩放和黏贴图像
1
2
3
4
5
6
|
>>> image1 = image. open ( './res/luohao.png' ) >>> image2 = image. open ( './res/guido.jpg' ) >>> rect = 80 , 20 , 310 , 360 >>> guido_head = image2.crop(rect) >>> width, height = guido_head.size >>> image1.paste(guido_head.resize(( int (width / 1.5 ), int (height / 1.5 ))), ( 172 , 40 )) |
旋转和翻转
1
2
3
|
>>> image = image. open ( './res/guido.png' ) >>> image.rotate( 180 ).show() >>> image.transpose(image.flip_left_right).show() |
操作像素
1
2
3
4
5
6
|
>>> image = image. open ( './res/guido.jpg' ) >>> for x in range ( 80 , 310 ): ... for y in range ( 20 , 360 ): ... image.putpixel((x, y), ( 128 , 128 , 128 )) ... >>> image.show() |
滤镜效果
1
2
3
4
|
>>> from pil import image, imagefilter >>> >>> image = image. open ( './res/guido.jpg' ) >>> image. filter (imagefilter.contour).show() |
处理excel电子表格
python的openpyxl模块让我们可以在python程序中读取和修改excel电子表格,当然实际工作中,我们可能会用libreoffice calc和openoffice calc来处理excel的电子表格文件,这就意味着openpyxl模块也能处理来自这些软件生成的电子表格。关于openpyxl的使用手册和使用文档可以查看它的官方文档。
处理word文档
利用python-docx模块,pytho 可以创建和修改word文档,当然这里的word文档不仅仅是指通过微软的office软件创建的扩展名为docx的文档,libreoffice writer和openoffice writer都是免费的字处理软件。
处理pdf文档
pdf是portable document format的缩写,使用.pdf作为文件扩展名。接下来我们就研究一下如何通过python实现从pdf读取文本内容和从已有的文档生成新的pdf文件。