如何为现代图形API编写渲染器 | Clean Rinse

告诉我这听起来是否熟悉：你想编写一个渲染器。OpenGL看起来对初学者很友好，教程资源丰富，但你也知道它已经被弃用，甚至被嘲笑；它不适合“真正的图形程序员”，不管这意味着什么。而它的替代品Vulkan则显得复杂且令人望而生畏，学习曲线陡峭，教程往往需要几个小时才能让屏幕上显示一个像素。即使完成了，你离实现低延迟、紧张刺激的多人FPS游戏目标依然遥远。

你可能听说过这样的说法：“样板代码主要是前置的。当然，绘制一个三角形需要5000行代码，但绘制一个充满动画NPC的巨型城市只需要5100行代码，甚至包括飞行汽车、HDR、布鲁姆和上帝光效……”然而，除非你亲自尝试过，尤其是通过教程学习，否则这种说法并不完全正确。从技术上讲，可能确实只有5100行代码，但你需要以复杂且脆弱的方式对其进行调整。

现代图形API的学习挑战

作为一名图形程序员，我非常喜欢Vulkan、Metal和Direct3D12等现代图形API，但不得不承认，它们的学习门槛很高。部分原因在于文档的缺失或不完整。API文档通常只是实现细节的描述性信息，而缺乏关于如何规划渲染器结构的指导。与OpenGL相比，现代API的一个显著区别在于，OpenGL允许你在没有明确蓝图的情况下摸索前行，而Vulkan则要求你从一开始就制定详细的计划。

样板代码的必要性

你可能会问：“如果样板代码每次都一样，为什么不直接集成到API中？”这是一个很好的问题。Vulkan和Direct3D 12的更新仍在探索如何在灵活性和易用性之间找到平衡。虽然样板代码的总体结构可能相似，但具体实现会因项目需求而异。通常，这些样板代码可能多达5000行，但它们的内容和组织方式会因项目目标的不同而有所变化。

构建渲染器的核心思路

绘制调用的设计

在渲染器中，绑定纹理、顶点数组、统一变量、着色器以及设置混合状态等操作，最终的目的是为绘制调用服务。例如，如果你需要绘制一个带有透明纹理的立方体，以下状态需要被绑定：

顶点绑定到立方体网格。
绑定透明纹理。
使用一个对纹理进行采样并返回颜色的着色器。
设置混合状态以实现透明效果。
设置深度模板状态以确保对象不会写入深度缓冲区。

需要注意的是，一个对象在同一帧中可能需要多次绘制调用。例如，一个窗户对象可能需要分别绘制木质框架（不透明通道）和玻璃窗格（透明通道）。如果还需要添加阴影效果，则需要额外的绘制调用。

避免常见错误

初学者常犯的一个错误是将渲染方法直接附加到游戏对象上，例如通过void Player::render()这样的结构。这种设计在需要支持多个绘制调用时会变得难以扩展。为了解决这个问题，建议设计一个更灵活的架构，使对象可以映射到多个绘制调用，并能够根据需要将这些调用路由到不同的渲染过程。

渲染过程的管理

渲染目标与多重渲染目标

在现代渲染中，屏幕上的内容实际上是渲染到纹理上的。这些纹理可以作为输入传递给后续的渲染过程。例如，后处理效果（如颜色校正、胶片颗粒）通常通过将场景渲染到一个纹理，然后对该纹理应用着色器来实现。

现代GPU支持“多重渲染目标”（MRT），允许着色器同时输出到多个渲染目标纹理。虽然理论上可以支持多达8个目标，但实际应用中通常使用不超过4个。

渲染过程的组织

渲染过程可以看作是一组绘制调用，这些调用共享相同的渲染目标纹理并在同一时间段内执行。例如，Bloom效果通常需要多次缩小图像以实现模糊效果，每个缩小步骤都对应一个独立的渲染过程。

随着渲染器的复杂性增加，管理这些渲染过程变得至关重要。一个有效的方式是将渲染过程组织成一个有向无环图（DAG），其中每个节点代表一个渲染过程，边表示数据依赖关系。像Frostbite的FrameGraph工具就是这种方法的典型应用。

渲染过程中的同步问题

GPU通过并行处理来实现高性能，但这也带来了同步问题。如果一个渲染过程的输出被另一个过程使用，GPU需要确保它们不会同时运行。在较旧的API（如OpenGL和Direct3D 11）中，驱动程序会自动处理这种同步，但现代API（如Vulkan）则将责任交给开发者。

避免数据冲突

在现代API中，开发者需要手动管理缓冲区的分配和使用，确保在GPU完成对缓冲区的使用之前不会覆盖其内容。这通常通过使用“围栏”或“时间线信号量”来实现，GPU在完成任务后会更新这些信号量，开发者可以通过检查信号量的值来判断缓冲区是否可以安全重用。

数据管理与优化

在旧的API中，纹理和缓冲区的分配和管理由驱动程序负责，而现代API要求开发者手动管理这些资源。这种变化虽然增加了开发复杂性，但也提供了更大的灵活性和性能优化的可能性。

例如，在Vulkan中，你需要为每个绘制调用分配独立的缓冲区，并确保它们不会被重复使用。这种方式虽然繁琐，但可以避免数据冲突并提高性能。

总结

现代图形API的复杂性为开发者提供了更大的灵活性，但同时也提出了更高的要求。通过合理规划渲染器的架构、有效管理渲染过程以及优化数据同步，可以显著提升渲染器的性能和可扩展性。

虽然本文没有深入探讨高级技术（如延迟渲染、材质系统设计等），但希望能够为你提供一个关于现代渲染器设计的整体框架。如果你对某些具体主题感兴趣，可以进一步查阅相关资源或工具，例如AMD的Render Pipeline Shaders或开源内存分配库。

原文链接: https://blog.mecheye.net/2023/09/how-to-write-a-renderer-for-modern-apis/