window 显示驱动开发-指定 GDI 硬件加速渲染操作

发布于:2025-05-23 ⋅ 阅读:(17) ⋅ 点赞:(0)

调用 DxgkDdiRenderKm 函数时,操作系统指定要通过 pRenderKmArgs 参数执行的 GDI 硬件加速呈现操作的类型。 DirectX 图形内核子系统的显示端口驱动程序 (Dxgkrnl.sys) 将 pRenderKmArgs-pCommand> 成员设置为指向包含可变大小DXGK_RENDERKM_COMMAND结构数组的命令缓冲区。 它还将 pRenderKmArgs-pCommandLength> 成员设置为命令缓冲区的大小(以字节为单位)。

驱动程序必须将输入DXGK_RENDERKM_COMMAND命令缓冲区转换为 DMA 缓冲区命令并生成修补程序位置列表。

DXGK_RENDERKM_COMMAND包含指定 GDI 硬件加速呈现操作的特征的成员,如下表所述。

呈现操作 DXGK_RENDERKM_COMMAND 成员 相应的DXGK_GDIARG_XXX结构 相应的DXGK_RENDERKM_OPERATION值

alpha 混合

AlphaBlend

DXGK_GDIARG_ALPHABLEND

DXGK_GDIOP_ALPHABLEND = 3

无拉伸的位块传输

BitBlt

DXGK_GDIARG_BITBLT

DXGK_GDIOP_BITBLT = 1

ClearType 和抗锯齿文本像素混合

ClearTypeBlend

DXGK_GDIARG_CLEARTYPEBLEND

DXGK_GDIOP_CLEARTYPEBLEND = 7

颜色填充

ColorFill

DXGK_GDIARG_COLORFILL

DXGK_GDIOP_COLORFILL = 2

拉伸位块传输

StretchBlt

DXGK_GDIARG_STRETCHBLT

DXGK_GDIOP_STRETCHBLT = 4

具有透明度的位块传输

TransparentBlt

DXGK_GDIARG_TRANSPARENTBLT

DXGK_GDIOP_TRANSPARENTBLT = 6

 操作系统使用 DXGK_RENDERKM_COMMAND 的 OpCode 成员来指示显示微型端口驱动程序必须处理的特定 GDI 硬件加速呈现操作。 OpCode 成员的类型为 DXGK_RENDERKM_OPERATION,其值显示在表中。

操作系统还将提供 DXGK_RENDERKM_COMMAND CommandSize 成员的相应值,该值指定当前呈现命令的大小(以字节为单位),包括 OpCode 的值和命令中的子矩形数。

1. 核心流程

当 DxgkDdiRenderKm 被调用时,驱动程序需完成以下任务:

1.解析命令缓冲区:

输入:pRenderKmArgs->pCommand 指向 DXGK_RENDERKM_COMMAND 结构数组。

长度:pRenderKmArgs->CommandLength 指定缓冲区总大小(字节)。

2.转换命令:将 DXGK_RENDERKM_COMMAND 转换为 GPU 可执行的 DMA 缓冲区指令。

3.生成修补列表:为动态资源(如纹理、顶点缓冲区)生成修补位置列表(Patch Location List)

 2. 命令结构:DXGK_RENDERKM_COMMAND

成员 类型 说明
OpCode UINT 操作类型(如 DXGK_GDIOP_BITBLTDXGK_GDIOP_ALPHABLEND)。
CommandSize UINT 当前命令的总大小(字节,含附加数据)。
Flags UINT 操作标志(如同步、缓存控制)。
pDstRect RECT* 目标矩形(可选,依赖操作类型)。
pSrcRect RECT* 源矩形(可选,如复制操作)。
AdditionalData BYTE[] 附加数据(如像素格式、混合参数)

常见操作码(OpCode):

  • DXGK_GDIOP_BITBLT:位块传输(传统 GDI 绘图)。
  • DXGK_GDIOP_ALPHABLEND:带 Alpha 混合的位块传输。
  • DXGK_GDIOP_STRETCHBLT:拉伸位块传输。
  • DXGK_GDIOP_CLEAR:填充矩形。

3. DMA 缓冲区生成与修补列表

(1) DMA 缓冲区要求
格式:必须符合 GPU 指令集架构(如 PM4、NVIDIA GPU 命令流)。

资源引用:

  • 使用 分配句柄(Allocation Handle) 引用显存中的纹理/缓冲区。
  • 动态地址需通过 修补列表 在提交前更新。

(2) 修补列表生成
作用:记录 DMA 缓冲区中需运行时修补的内存位置(如动态纹理地址)。

示例伪代码:

typedef struct {
  D3DGPU_VIRTUAL_ADDRESS GpuVa;  // GPU 虚拟地址
  UINT PatchOffset;              // DMA 缓冲区中的偏移量
} PATCH_LOCATION;

VOID GeneratePatchList(DXGK_RENDERKM_COMMAND* pCmd, PATCH_LOCATION* pList) {
  if (pCmd->OpCode == DXGK_GDIOP_BITBLT) {
    pList[0].GpuVa = GetTextureGpuVa(pCmd->AdditionalData);
    pList[0].PatchOffset = dmaBufferOffset + 0x10; // 示例偏移
  }
}

4. 分阶段处理(MultipassOffset 复用)

若命令缓冲区过大,需分多次处理:

保存进度:

  • 高16位:已处理的命令缓冲区偏移量。
  • 低16位:当前命令的子操作状态。

继续处理:下次调用时从 MultipassOffset 恢复进度。

示例:

UINT processedBytes = pRenderKmArgs->MultipassOffset >> 16;
while (processedBytes < pRenderKmArgs->CommandLength) {
  DXGK_RENDERKM_COMMAND* pCmd = (DXGK_RENDERKM_COMMAND*)((BYTE*)pRenderKmArgs->pCommand + processedBytes);
  if (!ConvertToDmaBuffer(pCmd, ...)) {
    // 更新进度并请求更多 DMA 缓冲区空间
    pRenderKmArgs->MultipassOffset = (processedBytes << 16) | currentSubOp;
    return STATUS_GRAPHICS_INSUFFICIENT_DMA_BUFFER;
  }
  processedBytes += pCmd->CommandSize;
}

5. 错误处理

状态码 场景
STATUS_SUCCESS 所有命令成功转换并提交。
STATUS_GRAPHICS_INSUFFICIENT_DMA_BUFFER DMA 缓冲区空间不足(需分阶段处理)。
STATUS_INVALID_PARAMETER 非法命令或参数(如无效矩形)。

6. 性能优化建议

命令批处理:合并多个 DXGK_RENDERKM_COMMAND 到单个 DMA 缓冲区以减少提交开销。静态命令缓存:缓存常用操作(如清屏)的 DMA 缓冲区片段。

异步修补:若硬件支持,在另一个线程中预生成修补列表。

7. 调试与验证

WDK 工具:使用 !dxgkdio.dumpcommand 内核调试器扩展解析命令缓冲区。

日志记录:记录 OpCode 和 CommandSize 以验证命令流完整性。

8. 总结

输入:DXGK_RENDERKM_COMMAND 数组描述 GDI 操作。

输出:DMA 缓冲区 + 修补列表,供 GPU 执行。

关键点:

  • 正确处理 MultipassOffset 以支持大型命令缓冲区。
  • 修补列表确保动态资源地址正确绑定。

网站公告

今日签到

点亮在社区的每一天
去签到