像素处理

图像像素的访问与裁剪

图片读入程序中后,是以 numpy 数组存在的。因此对 numpy 数组的一切功能,对图片也适用。对数组元素的访问,实际上就是对图片像素点的访问。彩色图片访问方式为:img[i,j,c],i 表示图片的行数,j 表示图片的列数,c 表示图片的通道数(RGB 三通道分别对应 0,1,2)。坐标是从左上角开始。

灰度图片访问方式为:gray[i,j],譬如输出小猫图片的 G 通道中的第 20 行 30 列的像素值:

from skimage import io,data
img=data.chelsea()
pixel=img[20,30,1]
print(pixel)

譬如显示红色单通道图片:

from skimage import io,data
img=data.chelsea()
R=img[:,:,0]
io.imshow(R)

像素值修改

除了对像素进行读取,也可以修改像素值。譬如对小猫图片随机添加椒盐噪声:

from skimage import io,data
import numpy as np
img=data.chelsea()

#随机生成5000个椒盐
rows,cols,dims=img.shape
for i in range(5000):
    x=np.random.randint(0,rows)
    y=np.random.randint(0,cols)
    img[x,y,:]=255
io.imshow(img)

这里用到了 numpy 包里的 random 来生成随机数,randint(0,cols)表示随机生成一个整数,范围在 0 到 cols 之间。 用 img[x,y,:]=255 这句来对像素值进行修改,将原来的三通道像素值,变为 255。通过对数组的裁剪,就可以实现对图片的裁剪。对小猫图片进行裁剪

from skimage import io,data
img=data.chelsea()
roi=img[80:180,100:200,:]
io.imshow(roi)

对多个像素点进行操作,使用数组切片方式访问。切片方式返回的是以指定间隔下标访问 该数组的像素值。下面是有关灰度图像的一些例子:

img[i,:] = im[j,:] # 将第 j 行的数值赋值给第 i 行
img[:,i] = 100 # 将第 i 列的所有数值设为 100
img[:100,:50].sum() # 计算前 100 行、前 50 列所有数值的和
img[50:100,50:100] # 50~100 行,50~100 列(不包括第 100 行和第 100 列)
img[i].mean() # 第 i 行所有数值的平均值
img[:,-1] # 最后一列
img[-2,:] (or im[-2]) # 倒数第二行

最后我们再看两个对像素值进行访问和改变的例子,将 lena 图片进行二值化,像素值大于 128 的变为 1,否则变为 0

from skimage import io,data,color
img=data.lena()
img_gray=color.rgb2gray(img)
rows,cols=img_gray.shape
for i in range(rows):
    for j in range(cols):
        if (img_gray[i,j]<=0.5):
            img_gray[i,j]=0
        else:
            img_gray[i,j]=1
io.imshow(img_gray)

使用了 color 模块的 rgb2gray() 函数,将彩色三通道图片转换成灰度图。转换结果为 float64 类型的数组,范围为[0,1] 之间。将彩色三通道图片转换成灰度图,最后变成 unit8, float 转换为 unit8 是有信息损失的。

img_path = 'data/dpclassifier/newtrain/test/1_0.png'
import Image as img
import os
from matplotlib import pyplot as plot
from skimage import io,transform, img_as_ubyte
img_file1 = img.open(img_path)
img_file1.show()
img_file2 = io.imread(img_path)
io.imshow(img_file2)
print(type(img_file1),img_file1.mode, type(img_file2),img_file2.shape, img_file2.dtype,img_file2.max(),img_file2.min(),img_file2.mean())

img_file22=skimage.color.rgb2gray(img_file2)
print(type(img_file22),img_file22.shape,img_file22.dtype,img_file22.max(),img_file22.min(),img_file22.mean() )
dst=img_as_ubyte(img_file22)
print(type(dst),dst.shape,dst.dtype, dst.max(), dst.min(), dst.mean())

(<class 'PIL.PngImagePlugin.PngImageFile'>, 'RGB', <type 'numpy.ndarray'>, (420, 512, 3), dtype('uint8'), 255, 0, 130.9983863467262)
(<type 'numpy.ndarray'>, (420, 512), dtype('float64'), 1.0, 0.0, 0.5137191621440242)
(<type 'numpy.ndarray'>, (420, 512), dtype('uint8'), 255, 0, 130.9983863467262)

先对 R 通道的所有像素值进行判断,如果大于 170,则将这个地方的像素值变为[0,255,0], 即 G 通道值为 255,R 和 B 通道值为 0。

from skimage import io,data
img=data.chelsea()
reddish = img[:, :, 0] >170
img[reddish] = [0, 255, 0]
io.imshow(img)

图像数据类型及颜色空间转换

数据类型

在 skimage 中,一张图片就是一个简单的 numpy 数组,数组的数据类型有很多种,相互之间也可以转换。这些数据类型及取值范围如下表所示:

Data type   Range
uint8     0 to 255
uint16    0 to 65535
uint32    0 to 232
float    -1 to 1 or 0 to 1
int8      -128 to 127
int16    -32768 to 32767
int32    -231 to 231 - 1

一张图片的像素值范围是[0,255], 因此默认类型是 unit8, 可用如下代码查看数据类型:

from skimage import io,data
img=data.chelsea()
print(img.dtype.name)

在上面的表中,特别注意的是 float 类型,它的范围是[-1,1]或[0,1]之间。一张彩色图片转换为灰度图后,它的类型就由 unit8 变成了 float。

  • unit8 转 float
from skimage import data,img_as_float
img=data.chelsea()
print(img.dtype.name)
dst=img_as_float(img)
print(dst.dtype.name)
  • float 转 uint8
from skimage import img_as_ubyte
import numpy as np
img = np.array([0, 0.5, 1], dtype=float)
print(img.dtype.name)
dst=img_as_ubyte(img)
print(dst.dtype.name)

float 转为 unit8,有可能会造成数据的损失,因此会有警告提醒。除了这两种最常用的转换以外,其实有一些其它的类型转换,如下表:

Function name   Description
img_as_float    Convert to 64-bit floating point.
img_as_ubyte    Convert to 8-bit uint.
img_as_uint     Convert to 16-bit uint.
img_as_int      Convert to 16-bit int.

颜色空间

如前所述,除了直接转换可以改变数据类型外,还可以通过图像的颜色空间转换来改变数据类型。常用的颜色空间有灰度空间、rgb 空间、hsv 空间和 cmyk 空间。颜色空间转换以后,图片类型都变成了 float 型。

所有的颜色空间转换函数,都放在 skimage 的 color 模块内。

  • 例:rgb 转灰度图:
from skimage import io,data,color
img=data.lena()
gray=color.rgb2gray(img)
io.imshow(gray)

其它的转换,用法都是一样的,列举常用的如下:

skimage.color.rgb2grey(rgb)
skimage.color.rgb2hsv(rgb)
skimage.color.rgb2lab(rgb)
skimage.color.gray2rgb(image)
skimage.color.hsv2rgb(hsv)
skimage.color.lab2rgb(lab)

实际上,上面的所有转换函数,都可以用一个函数来代替:

skimage.color.convert_colorspace(arr, fromspace, tospace)

表示将 arr 从 fromspace 颜色空间转换到 tospace 颜色空间。

  • 例:rgb 转 hsv
from skimage import io,data,color
img=data.lena()
hsv=color.convert_colorspace(img,'RGB','HSV')
io.imshow(hsv)

在 color 模块的颜色空间转换函数中,还有一个比较有用的函数是 skimage.color.label2rgb(arr), 可以根据标签值对图片进行着色。以后的图片分类后着色就可以用这个函数。

  • 例:将 lena 图片分成三类,然后用默认颜色对三类进行着色
from skimage import io,data,color
import numpy as np
img=data.lena()
gray=color.rgb2gray(img)
rows,cols=gray.shape
labels=np.zeros([rows,cols])
for i in range(rows):
    for j in range(cols):
        if(gray[i,j]<0.4):
            labels[i,j]=0
        elif(gray[i,j]<0.75):
            labels[i,j]=1
        else:
            labels[i,j]=2
dst=color.label2rgb(labels)
io.imshow(dst)
上一页