我再次通读了“ImageNet Classification with Deep Convolutional Neural Networks”,专门了解如何实现 PCA 颜色增强的详细信息。我不确定我是否正确。这是我在 numpy 中的操作方式:
# original image is 224x224x3 of dtype uint8
renorm_image = np.reshape(original_image,(original_image.shape[0]*original_image.shape[1],3))
renorm_image = renorm_image.astype('float32')
renorm_image -= np.mean(renorm_image, axis=0)
renorm_image /= np.std(renorm_image, axis=0)
cov = np.cov(renorm_image, rowvar=False)
lambdas, p = np.linalg.eig(cov)
alphas = np.random.normal(0, 0.1, 3)
delta = np.dot(p, alphas*lambdas)
delta = (delta*255.).astype('int8')
pca_color_image = np.maximum(np.minimum(original_image + delta, 255), 0).astype('uint8')
一个严重的疑问是“delta = (delta*255.)”这一行。我必须这样做才能重新调整数字,使数字有意义。如果这是正确的,我希望有人可以给我反馈。