超采样什么意思_采样频率和采样点数联系[通俗易懂]

超采样什么意思_采样频率和采样点数联系[通俗易懂]本身来说超采样的概念并不新鲜,比如现在已经基本被边缘化的CD,玩过的人应该都知道它的标准码率是44.1kHz,为什么是这个数值?是因为人类听觉的频率上限为22kHz,根据奈奎斯特采样定律,在数字采样时取2倍频率进行采样就

本身来说超采样的概念并不新鲜,比如现在已经基本被边缘化的CD,玩过的人应该都知道它的标准码率是44.1kHz,为什么是这个数值?是因为人类听觉的频率上限为22kHz,根据奈奎斯特采样定律,在数字采样时取2倍频率进行采样就能准确还原原始信息,所以才有了44.1kHz之说,实质上也就属于超采样的一种,在音频/图像处理领域都非常常见,标题里拟出的是它近期在民用数字成像处理领域比较火的应用,在我的文章里也时常提到,此前也有人很不客气地提出过质疑,那么,超采样神奇的地方究竟在哪呢?

首先,我们知道数字图像都有位元深度bit一说,比如现有的CMOS传感器RAW主要在14bit,JPEG则是8bit,TIFF可以到16bit,而位元严格来说就是分辨率的概念,我们知道数字成像的基本原理是光信号转模拟电信号再转数字信号,对图像传感器而言,空间中的光信号是无穷多的,所以模拟信号需要以像素为单位一次采样,而转换为数字信号时又会以bit为频率单位进行一次采样,以一个波形为例:

21963cdd486a37fe1b28c1e8bfa90db0.png

2bit的模数转换采样意味着我们只能取值4次,只能把红色模拟信号重建成蓝色线这个样子,如果转换为数字图像显然是没法看的,它会带来很明显的噪声,也即量化噪声,而如果把模数转换增加到3bit:

02559aac9445f71fb541a9bb4e0ff85d.png

8次取值看起来是不是比4次好多了?所以单以数字成像为例,模数转换的位元数越高,就意味着更好的采样重建,量化噪声也会相对变小,而与量化噪声相关的信噪比公式是20log10(2^Q),约等于6.02Q,这里的Q就是模数转换位元深度,比如14bit模数转换就意味着它的最大量化噪声信噪比是84.28dB。

所以在数字图像领域,模数转换位元数值是越高越好、高高益善,但位元数越高,对于芯片设计来说是挑战越大(除了量化噪声外,还有开关电源噪声、采样时钟抖动噪声、微分/积分非线性误差带来的噪声与谐波、热噪声、PCB信号串扰噪声等等因素),很容易出现理论与实测数值差距较大的问题,除此之外高精度模数转换也意味着数据量的剧烈膨胀,所以在数字图像端,目前即便是高精度领域的应用也基本是以16bit为上限。

如果大学数学没有还给老师的话,应该就还记得傅里叶变换基本原理就是任何周期函数,都可以看作是不同频率的正弦和或余弦和的叠加,对于数字图像处理来说,将空域变换到频域进行计算是非常常规的操作,因此采样率除了模数转换位元数值之外,同样也取决于频域采样单位的总数,也就是传感器像素密度。

这意味着,我们既可以通过把200万采样像素传感器8bit模数转换器更换为10bit来提升数字信号端的采样精度,同样,也可以不改变模数转换器精度,而是通过将模拟信号端的采样像素提高到3200万来实现。就像前面那张2bit、3bit模数转换采样对比图,红色线,也就是对空间采用的模拟信号精细度是随采样像素增加而增加的,当像素相对较少时就意味着这条线有更明显的锯齿,这时候上再高精度的模数转换器也无济于事。而这种增加空间采样像素的做法就是我们平时所说的超采样,理想的数字图像应该是由高像素密度和高模数转换位元数共建的,两者相辅相成。

0f77f0eb742fcd65fa73a11132144fe3.png

4K视频,比如3840X2160也不过仅仅只有约830万像素,如果是一个单纯的视频器材,做原生4K像素的好处就是有利于实现高帧率,而且传感器可以做得很小。但对于要兼顾静态摄影的机身来说830万实在是太不够看了,大底也是一个很明显的趋势,而在数千万级的分辨率下如果不做超采样,又会意味着非常明显的视野裁切,所以超采从商业角度就是必上的设计。超采幅度越大,镜头视角裁切幅度越小,全宽采样时就只需要裁切上下部分了,对角线和宽度都能保证原生视野,但这也会对传感器读出速度有更高的要求,所以各家会根据自己的硬件性能对超采幅度进行取舍。

对于模数转换器来说,n bit的等效提升就需要连续采样2^2n次,比如14bit想要实现单次16bit的效果,就需要进行16倍采样,而这会带来4倍(16开方)、2bit(4=2^2)、12dB(20Log(4))的信噪比增益以及16倍、4bit(16=2^4)、24dB(20Log(16))的动态范围增益。假设一个207万全高清视频用16倍像素,也就是3317万像素传感器超采样,这块传感器与一块原生全高清传感器尺寸相当、且采用完全相同的工艺制造,虽然两者在各自原生分辨率下的动态范围和信噪比是一致的,但当输出到全高清显示器上全屏播放时,因为超采样的关系,信噪比就提升了12dB、动态范围增益了24dB,没错,就可以视作为从8bit模数转换等效提升到了10bit。沿用此算法,小画幅理论上是可以利用大幅度超采,来实现画质超越更大画幅。

a0d42613e289bb8716a99e570d5d3bff.png

对于照片来说也是相同的道理,超采n倍,信噪比提升Log2(n的平方根) bit,动态范围提升Log2(n) bit,所以视频超采样与照片缩图大法从技术上来看是殊途同归,体现在画面上的直观感受就是虽然同样是铺满显示器观赏,但细节更清晰,噪声也变少了(叠加n次均值后的随机噪声为单次的1/n,以前有过详细的数学推算,今天就不赘述了),详细可参考上面这张高像素机型在高ISO下缩图到高速度机型原始像素密度后的对比,可以看到无论5DSR还是D850,分辨率都可以胜过1DX2和D5,如果图片看不清可以自行到DPreview上手动对比。

所以说,超采样的概念从频域角度来看就比较容易理解了,此前聊过的1亿像素拍摄手法,也就是手持像素偏移方案的最终目的也是为了提升频域采样率,目前能想到比较终极的解决方案就是像素偏移+包围曝光或连拍堆栈,这就是频域+空域的双向结合,虽然数据量可能大到离谱,但却是理论可行的单机画质提升强力方案之一,堪称键盘摄影的终极杀招!

当然,在超采样之余再加入伽马校正,也就是各家的Log功能后,可以在文件体积更小的情况下实现接近RAW输出的效果(其实对于视频而言,RAW有时候并不一定代表最好)。既然超采样的目的是提高信噪比和动态范围,Log功能也是以此为目的,那就顺带聊聊吧,就不单独开文章了。大多没有接触过视频制作的朋友可能对Log有所耳闻,但又不清楚它在非RAW的前提下是如何实现高动态范围的,事实上Log从原理上来说也就是在Photoshop里很常见的操作——拉曲线。我们知道传感器在模数转换时是线性的,比如一张8bit的图像,取值就应该在0-255之间,用图表来看关系如下:

84cd89bb28204be839e937d575c15225.png

随便画的不是特别精准,请不要在意,把注意力放在这条直线上,线性响应的问题在于,在总值仅仅256个的情况下,7~8bit之间足足就挤压了128个取值,6~7bit之间又有64个,在Y轴等比延长的情况下,真实曲线大致是这个样子的:

f083f18b1af8ec3ebf34efb206d2960c.png

很明显,对光生电子产生的电压信号为线性响应很正常,但它并不能非常好的反馈到模数转换的过程中,因为模数转换的响应变化是对数形式的(所以伽马校正曲线全称才叫Logarithm Gamma Curve,除此之外还有专门设计为对数响应模式的传感器,目的也是提升动态范围),对于一些光比较大的环境时,左侧暗部区间往往得不到正确的输出,形成比较明显的欠曝,而如果面对的是一张欠曝的照片你在后期里会怎么处理?会不会第一时间想到用曲线工具来拉一下左下部分让暗部回到正确曝光上来,Log在视频里要做的就是这件事:

b49b60fb20c6a88f62408ce8de644ffe.png

各家的各类Log曲线各不相同,细分有很多,但赋值的目标基本都是增加动态范围,在最终曲线真正回到更趋近于平直的状态后再重新对色彩分级校正,就能获得高动态范围的视频内容了。当然,这里还有一个关于增益和ISO的话题,但会扯得比较远,找机会再详细聊,大家不妨思索一下为什么在很多Log模式下ISO会从很高的数值开始起跳,比如索尼的Slog3就需要从ISO 3200开始。

基本上关于超采样及其延伸话题就是这样,如果有兴趣,以后还可以找时间聊聊算法上的具体设计,今天差不多就先这样吧。

今天的文章超采样什么意思_采样频率和采样点数联系[通俗易懂]分享到此就结束了,感谢您的阅读。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/83679.html

(0)
编程小号编程小号

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注