Data normalization
本篇主要讨论一些常用的数据归一化方法,以及其相应的影响。这里全部基于2-d的图像来讨论。
Range Normalization
- [-1,1]
- [0, 1]
DC Removal
- 原理
DC(dirrect current)来源于电子工程中的直流电。简单点的说就是移除本身的均值,其使得整张图像的均值为0
,如下:
- 作用
coming soon
Mean Normalization
- 原理
均值归一化就是使每个位置的像素的均值为0
(注意其和DC Removal的区别)。如下:
- 作用
coming soon
STD Normalization
- 原理
标准差归一化就是使每个位置的像素的均值为0且其每个位置像素的方差为1
(其就是在均值归一化后再除以每个位置像素的标准差)。如下:
为了抑制噪声,一般在方差上加上一个常数项,见文章4。则公式变成如下形式:
- 证明
SCN(Spatial constractive Normalization)
- 原理
详细分析见renference[2]和[3],其实就是局部的标准化归一化
。其公式如下:
- 细节
需要消除边缘效应
在式(1)和(2)中应用在图像边缘时,其外面是补0的。因此边缘处的与要较中间部分的小。可以乘以一个权重因子进行补偿在做SCN之前先做标准差归一化后,效果比较平滑,否则会有噪声
因为Std Norm将每个位置的数据方差归一化到了1,压制住了噪声,效果如下:
(平滑效果好还是带噪声的好,有待讨论。如作为分类的预处理,平滑是否会干掉太多的细节?)
Reference
- Natural Image Statistics(Chapter 5)
- Pinto, Cox. Why is real-world vi- sual object recognition hard? 2008
- Lyu, Simoncelli. Nonlinear image representation using divisive normalization. 2008.
- Learning Feature Representations with K-means