逼真的渲染：我需要考虑人眼和大脑的哪些过程？

逼真的渲染的目的是渲染图像，就像真实的相机会捕获它一样。尽管这已经是一个雄心勃勃的目标，但在某些情况下，您可能需要更进一步：以人眼可以捕捉到的图像甚至人类可以感知到的方式渲染图像。您可以将其称为视觉现实或感知现实渲染，但是如果有人能提出一个更吸引人的术语（或告诉我已经存在一个术语），我将不胜感激。

这里有一些例子可以说明我的观点。用低照度的相机拍摄照片时，您可能拥有好的镜头或噪点较大的图像。对于人类观察者来说，暗视会产生作用并产生浦肯野效应（颜色会变成蓝色）。这种效果取决于HDR亮度信息，当我在LDR显示器上显示图像时，这些信息会丢失。另外，人脑可以使用深度信息来“过滤”感知到的图像-在最终（非立体）渲染中丢失的信息。

整理详尽的清单可能是一个难以实现的目标。您能否建议我需要考虑的对眼睛和大脑的某些影响？

human-vision

— 大卫·库里（David Kuri）
source

我曾经听说我们的噪音确实与相机相同，因为噪音实际上是物理上的，而不仅仅是电子上的。（即毕竟没有那么多的光子）。但是我认为，大脑会使用暂时的抗锯齿功能将其擦除。（即我们在晚上看到很多运动模糊）。

— v.oddou

我不太明白。如果在弱光下渲染图像并模拟Purkinje效果，由于人眼会添加自己的效果，因此它看起来不真实，不是吗？

— Yves Daoust

@YvesDaoust由于图像是在未知光照条件下显示在LDR监视器上的，因此可能不会。简而言之，您在屏幕上看到的图像会更亮，因此更容易感知。如果我们使用的是HDR监视器，并且可以准确地再现夜间场景的亮度值（并且还有一个黑暗的房间），那您是对的。

— 大卫·库里

您所追求的目标没有错，但是我担心这似乎有点太广泛了，因为我们需要考虑的影响是如此之多。我无法以SE格式编写此文件，因为这确实是错误的。但是，如果您将范围调整为“可以建议一些我需要考虑的影响”，则比开始更容易。

— joojaa 2015年

@joojaa我按照您的建议更改了问题，谢谢。

— 大卫·库里

Answers:

您可能需要更进一步：以人眼可以捕捉到的图像甚至人类可以感知到的方式渲染图像。

有两种解释方法。我都会做。

解释1：渲染看起来在视觉上逼真的图像。

最终，您的图像仍然需要显示在某个地方。关键是：您要以这样的方式渲染图像，即在特定显示设备上*显示*该图像时，它会产生与原始辐射图像相同的感觉。

这是解开这个想法的方法。

在现实世界中，辐射光谱（即光的真实分布）进入您的眼睛并刺激大约^1个四个光接收器。受体的刺激会产生与图像相关的色彩感。

在渲染中，我们对生成的光谱没有任意控制权。幸运的是，由于我们（通常）只有三个视锥，每个视锥仅产生一个标量值，因此可以通过恰好使用三个基色来再现色彩视觉。最重要的是，您仅使用三个波长的线性组合即可产生任何颜色感（最多可能需要是负数的几种颜色，在这种情况下，您将使用不同的原色）。

您没有其他选择。几乎所有的彩色显示设备都使用sRGB标准，该标准提供三个基色（实际上通常没有单个波长）。很好，因为事实证明它们都是抽象的，您不必在意。

为了弄清在视觉上准确渲染的混乱，下面是算法：

使用正确的辐射度计算渲染图像。您可以跟踪单个波长的光或波长段。随你。最后，您将获得一张图像，该图像具有在每个点处接收到的光谱的表示。
在每个像素处，获取渲染的光谱，并将其转换为CIE XYZ颜色空间。这样做可以将光谱的乘积与标准的观察者功能集成在一起（请参阅CIE XYZ定义）。
这将产生三个标量值，即CIE XYZ颜色。
使用矩阵变换将其转换为线性RGB，然后从那里使用线性/幂变换将线性RGB转换为sRGB。
从浮点转换为uint8并保存，将值限制在范围之外（您的监视器无法表示它们）。
将uint8像素发送到帧缓冲区。
显示屏采用sRGB颜色，进行逆变换以生成特定强度的三个原色。每个都缩放其负责的任何像素的输出。像素点亮，产生光谱。该光谱（希望）是您绘制的原始光谱的一个同分异构体。
您可以像感知渲染频谱一样感知频谱。

解释2：尝试模拟人眼可能会收到的最终数据，以进行可视化或补偿LDR显示。

我认为，这一含义不那么有用。本质上，您正在尝试生成一种图像，该图像会调整大脑为娱乐/获利而感知的方式。

例如，今年SIGGRAPH上有一篇论文，他们模拟了残像和色彩还原，以使图像看起来在感觉上有所不同。当然，他们这样做的唯一原因是因为我们使用的显示器都是低动态范围（LDR）。关键是要模拟某人在实际的高动态范围（HDR）显示下作为实际图像数据可能看到的效果。

在实践中，结果证明效果不佳。例如，对于残像，我们看到残像是因为非常明亮的刺激耗尽了色细胞。如果您改为尝试使用伪造的残像来刺激效果，则看起来可能有点相似-但由于它是一种完全不同的机制，因此并不是很令人信服。

如果您想尝试一下，这种图形实际上在文献中还没有得到充分研究。所提到的论文或多或少是我们拥有的最先进方法的示例。我认为，尽管如此，目前的共识是，（至少在此时）不值得尝试进行仿真，因为充其量，您最多只能通过替代不同的视觉效果来逼近真实的视觉效果，而这并不是真的工作。

¹杆+ 3 *锥，通常情况。近似值是因为人类可能只有零个功能性光接收器，最多推测为七个（有史以来观察到的最高值为五个）。

— 马尔默
source

感谢您的回答。我认为这是不完整的。解释1中的陈述“您感觉到的频谱就像您看到的频谱一样”，这可以说是错误的。感知真实频谱时，使用您描述的转换不会产生效果（例如，您必须在光线不足的情况下使用暗视标准观察者，如Jameson，Hurvich：Visual Psychophysics中所述）。您所描述的是光谱渲染的想法。解释2是我想了解的更多信息。谢谢，本文将是一个好的开始。

— 大卫·库里

当涉及感知时，还存在一个问题，即我们几乎看不到的东西（就属性或伪像而言），以及我们对感知的强制性。

例如，对于声音，您拥有的对比度或频率使您对其他内容的了解减少或不了解（旧的SIGGRAPH论文说明了纹理如何掩盖网格分辨率）以及所有时间方面的问题（Google表示“改变盲目性”）。同样，根据值和相对值，可能会或可能不会看到表面，法线和BRDF的详细信息。

同样，由于我们的感知系统倾向于局部和全局适应，因此对于低频值，在适当的位置具有最大值和最小值很重要，但是它们的确切值不会真正被注意到。

有时可能会有认知，就像您在云朵和树木中允许很多错误，但在人脸中肯定会更少。（有时您可能会将其降级为给定类别的参数统计信息。）

这就是为什么我更喜欢使用“合理”一词而不是“真实感”一词的原因。

相反，我们对假象或闪烁像素等伪影非常敏感，对相关性（例如仅1个灰度级的误差前沿，不想要的图案（例如莫尔条纹，混叠或不良随机性）等相关性非常敏感）。

顺便说一句，这是基于感知的总括而言，基于优化的解决方案以简单的能量汇总所有内容可能是一个非常糟糕的主意的原因之一，因为在所有自相矛盾的情况下，这都可能导致线或点的误差集中。出于同样的原因，早期的全球照明人员真的感到失望的是，与反走样的近似阴影相比，能量精确解决方案的接受度较低（然后从基于四叉树的方法到基于网格的自适应方法）。

有关SigAsia的“图形感知”的概述（相当普遍）可以在SigAsia的“ 11，图形，可视化，虚拟环境和动画的感知”课程中找到。

— 法布里·尼雷
source