游戏引擎学习第126天-EW帮帮网

仓库:https://gitee.com/mrxiao_com/2d_game_3

单生产者/多消费者问题

在今天的讨论中，主要与多线程编程有关。问题出现在多线程环境中，当多个线程同时访问共享资源时，代码没有正确处理竞争条件，导致了错误的行为。

具体问题发生在处理工作队列的代码中，原本的设计假设是单生产者单消费者模式。然而，实际情况是多线程环境中会有多个消费者线程，因此这个假设是错误的。代码中对队列的访问没有正确同步，导致多个线程可能会同时检查并修改同一个队列中的数据，进而产生并发错误。

例如，代码检查了队列的条目数量，并根据这一数量决定是否从队列中取出一个条目。但问题在于，代码只检查了队列的条目数量，而没有考虑其他线程可能已经抢先取走了队列中的条目。这样就有可能发生两个线程同时通过检查并增加计数，导致其中一个线程访问到已经被另一个线程取走的队列条目，从而产生越界错误。

这种错误的根本原因在于，使用了“互斥增量”（interlocked increment）来增加队列中的条目计数。这个方式假设在检查和修改过程中只有一个线程会操作这个计数，但在多线程环境下，多个线程可能会同时执行增量操作，导致计数不准确，最终导致队列访问出错。

为了解决这个问题，正确的做法是使用“互斥比较交换”（InterlockedCompareExchange）。这种方法能够确保在修改计数时，只有一个线程能够成功地更新计数值，其他线程会等待，从而避免了并发修改导致的错误。使用这种方式，我们无需担心多个线程同时修改共享数据的情况，也不需要特别复杂的逻辑来保证数据的一致性。

简而言之，正确的做法是用互斥比较交换（InterlockedCompareExchange），它能够有效避免并发问题，并确保程序的正确性和稳定性。

在这里插入图片描述

InterlockedCompareExchange

为了避免并发问题，我们采用了“互斥比较交换”（InterlockedCompareExchange）的方法。这种方法的核心是通过比较当前值和预期值，如果当前值与预期值匹配，就将新的值写入目标位置；如果不匹配，则不执行任何操作。

具体而言，互斥比较交换的工作方式是这样的：它会接收三个参数——目标地址、要存储的新值和要比较的当前值。它会检查目标地址的值是否等于给定的当前值。如果两者相等，新的值就会被存储到目标地址中；如果不相等，则不做任何更改。无论操作是否成功，函数都会返回目标地址中原先存储的值。

这种机制的优点在于，它允许多个线程安全地操作共享数据，而无需担心并发修改带来的问题。因为只有当目标地址的值与当前值匹配时，新的值才会被写入，这样就确保了数据的一致性。通过这种方式，我们避免了在多线程环境中出现数据竞争和不一致的问题，保证了程序的正确性和稳定性。

InterlockedCompareExchange 是一种原子操作，通常用于多线程编程中，确保在并发环境下对共享数据进行安全操作。它的作用是比较目标位置的当前值和预期值，如果两者相等，则将新的值存储到目标位置。这个操作是原子性的，即它在执行时不会被其他线程中断，因此非常适合用来避免并发修改带来的问题。
在这里插入图片描述

函数原型（C/C++）：

LONG InterlockedCompareExchange(
  volatile LONG* Destination,   // 目标地址
  LONG Exchange,                 // 要存储的新值
  LONG Comperand                // 预期的当前值
);

参数解释：

Destination：目标地址，表示存储新值的位置。这个位置的值会在比较过程中被检查。
Exchange：新值，如果目标地址的值等于预期的当前值，就会把这个新值写入目标地址。
Comperand：预期的当前值，InterlockedCompareExchange 会检查目标地址的值是否与这个值匹配。

操作过程：

如果目标地址的值等于 Comperand，那么 Exchange 的值会被存入 Destination。
如果目标地址的值不等于 Comperand，则不会进行任何写入操作，Destination 中的值保持不变。
无论操作是否成功，InterlockedCompareExchange 返回的是 Destination 中原先的值。

返回值：

返回目标地址（Destination）中原始的值，不管操作是否成功。

使用场景：

确保线程安全：多线程并发修改同一数据时，InterlockedCompareExchange 可用来避免数据竞争，确保只有一个线程成功地修改数据。
实现锁-free 数据结构：通过这个操作可以实现高效的并发数据结构，比如无锁队列和无锁栈等。
状态检查和更新：用它来确保线程在更新某些状态之前，当前状态没有被其他线程改变。

示例：

假设我们有一个共享的整型变量 counter，并希望安全地将它递增1，但在递增之前需要确保它的当前值没有被其他线程改变过。

LONG counter = 0;  // 共享计数器

// 在多线程环境中，我们希望递增 counter 之前，确保没有其他线程修改它
LONG current = counter;
LONG newCounter = current + 1;

// 使用 InterlockedCompareExchange 确保原子递增
LONG oldValue = InterlockedCompareExchange(&counter, newCounter, current);

if (oldValue == current) {
    printf("成功递增计数器，新值: %ld\n", newCounter);
} else {
    printf("计数器在递增前已经被修改。\n");
}

总结：

InterlockedCompareExchange 提供了一种安全的方式来处理多线程环境中的共享数据，避免了常见的并发问题，如数据竞争和不一致性。它是一种原子操作，在多线程编程中非常有用，尤其是在需要保证数据一致性和线程安全的情况下。

修复我们的问题

在这个讨论中，我们正在处理一个工作队列，并讨论如何利用“互斥比较交换”（InterlockedCompareExchange）来安全地操作队列中的数据。目标是确保多线程环境中，多个线程不会同时修改队列，避免竞态条件。

关键操作流程：

检查队列是否有任务：
我们首先需要检查队列中是否有待处理的任务。通过使用 InterlockedCompareExchange，可以确保只有一个线程能够访问和修改队列的状态。
使用互斥比较交换进行安全更新：
我们使用 InterlockedCompareExchange 来更新队列的状态。具体来说，我们想要将队列中的某个值替换成新的值。InterlockedCompareExchange 会比较当前值与预期的值，如果两者相等，则将目标值更新为新的值。返回的是目标位置的原始值，允许我们知道是否成功进行了更新。
如何处理返回的索引值：
- 如果返回的索引值与我们预期的值相同，则说明队列的状态没有被其他线程修改，操作成功，可以继续执行后续的任务。
- 如果返回的索引值与预期不同，说明其他线程已经修改了队列的状态，我们的操作失败。此时，我们应该放弃当前操作，不做任何更改，以避免数据不一致。
处理失败的情况：
由于多线程并发的特性，即使有工作任务，可能仍会出现操作失败的情况。因为如果一个线程在更新队列时被其他线程抢先修改了队列的状态，就会导致当前线程的操作失败。
优化失败处理：
为了处理这种失败情况，应该有额外的步骤来保证在队列有任务时仍能正确地处理。虽然我们能通过比较和交换确保队列的状态一致，但有时也需要额外的逻辑来简化操作，避免频繁的失败和重试。

总结：

通过使用 InterlockedCompareExchange，我们可以安全地在多线程环境下操作队列，避免多个线程同时修改同一数据。关键在于通过比较当前值与预期值来确保数据的一致性，避免了常见的竞态条件和数据竞争问题。对于失败的情况，我们需要处理好失败的恢复逻辑，以确保系统稳定性和任务的正确执行。

通过 API 更改进一步简化

在这段讨论中，我们面临的主要问题是多线程队列的管理，以及如何通过结构重构来简化代码和提高多线程操作的效率。

关键点：

简化处理过程：
当前的处理方式可能过于复杂，需要进一步简化。原本计划是通过一个功能来处理渲染工作，但现在的目标是通过更简单的结构进行处理，从而确保功能的正常运行。
重构API设计：
之前在设计API时，采取了平台无关的方式，但后来决定通过简化处理，直接使用“添加条目”（AddWorkQueueEntry）和“完成所有工作”（MarkQueueEntryCompleted）这两个功能来管理工作队列。这个改变使得结构更加清晰，也避免了不必要的复杂化。
线程同步问题：
多线程编程时，最初的设计假设是只有一个线程处理队列，这种单线程假设下使用“互斥增量”（InterlockedIncrement）就能很好地工作。然而，当多个线程同时访问同一个队列时，这种方式就不再适用，因为多个线程可能会竞争修改同一数据，导致不一致。为了处理这种情况，改用了“互斥比较交换”（InterlockedCompareExchange），它能够确保只有一个线程能成功修改队列数据。
使用互斥比较交换的优势：
使用 InterlockedCompareExchange 后，线程在操作队列时，不需要担心操作会失败或数据被其他线程修改。它允许线程在操作之前假设某个值，并在尝试修改时检查该值是否与预期一致。如果一致，则继续执行修改操作；如果不一致，则不进行任何修改，避免了潜在的竞态条件。这种机制类似于“事务性内存”，但是针对单一值的操作，能够确保数据的一致性。
调整设计以适应多线程环境：
初始时，队列的设计假设是只有一个线程处理，因此使用了简单的增量操作。但在多线程环境下，需要更复杂的同步机制。使用 InterlockedCompareExchange 让队列管理变得更加可靠，避免了线程间的竞争和数据损坏。
后续步骤：重构和优化：
为了使多线程渲染能够正常运行，需要重新调整队列的结构和管理方式，并确保所有的操作都能在新的API设计下正常执行。接下来需要进行代码重构，使得所有操作都能根据新的设计架构顺利运行，同时确保队列的管理更加高效和安全。

总结：

主要的目标是通过简化队列管理和改进同步机制，使得多线程渲染和工作队列能够稳定运行。关键在于选择正确的线程同步机制，避免不必要的复杂性，最终通过“互斥比较交换”来确保线程安全和数据一致性。

实现多线程 API

在这段讨论中，重点是如何将工作项添加到多线程队列中，并确保多线程环境下的同步机制正确。以下是对讨论内容的详细总结：

主要步骤和内容：

工作队列的添加条目函数：
在多线程的工作队列中，每个工作项需要通过一个函数签名进行处理。这个函数包含了工作队列和相关的数据指针。通过这种方式，可以将需要执行的任务添加到队列中，并确保每个任务能够在正确的线程中执行。
定义回调函数：
每个工作项都将包含一个回调函数和相关数据，这些数据指针是程序根据需要传递给队列的。工作队列条目将存储回调函数和数据指针，以便在处理时调用对应的函数。
使用 InterlockedCompareExchange 进行线程同步：
在多线程环境下，我们希望能够让多个线程同时添加工作项。为了确保线程安全，决定使用 InterlockedCompareExchange 来同步修改工作队列的条目计数。这样，即使多个线程同时尝试添加工作项，也能避免出现竞态条件。通过这种方式，每个线程可以尝试修改队列的状态，只有当预期的状态与当前值一致时才会进行修改。
写入条目信息并增加计数：
在将工作项添加到队列之前，首先需要确保写入条目的数据和回调信息。工作队列条目存储了回调函数和数据指针，必须先写入这些信息，再增加队列的条目计数。写入操作完成后，增加条目计数并递增信号量，确保队列的同步操作顺利进行。
使用内存屏障确保数据一致性：
为了确保数据的顺序性和一致性，使用了内存屏障（Memory Barrier）。即使在使用 InterlockedCompareExchange 时，仍然需要使用内存屏障来保证数据在多线程环境下的一致性和正确性。
未来改进方向：
目前的实现中，只有一个线程能够向队列添加条目。但如果未来需要支持多个线程同时添加条目，可以进一步优化代码，通过 InterlockedCompareExchange 来允许多个线程同时操作队列。虽然这种做法可能会引入一些复杂性和潜在的错误，但值得尝试。
处理错误和调试：
在实现过程中，可能会遇到一些错误和问题，需要通过不断调试和测试来确保多线程队列的正确性。如果遇到异常行为，比如线程竞争导致的问题，可以通过回退策略来修复和调整代码，确保系统的稳定性。

总结：

本次讨论的核心在于如何在多线程环境中安全地向队列中添加工作项。通过使用 InterlockedCompareExchange，可以确保多个线程同时操作队列时的同步性和数据一致性。接下来的步骤是继续优化代码，允许多个线程同时向队列添加条目，并确保所有操作都能在正确的顺序和同步机制下进行。
在这里插入图片描述

通过管道传递工作队列

这段讨论主要是关于如何在平台层实现工作队列，并且在多线程环境中通过渲染队列来实现任务调度和工作流的管理。以下是详细的总结：

主要步骤和内容：

平台层和工作队列结构：
首先，平台层中需要定义一个工作队列来管理渲染任务。这里的工作队列将通过渲染队列来实现，目的是在多线程环境下安全地管理任务的添加与执行。为了支持这种功能，平台层会使用一个指向工作队列的指针。
在平台层添加工作队列：
通过在平台层定义一个工作队列（如 platform_work_queue），然后在渲染模块中引用这个队列，可以实现将渲染任务加入队列的功能。工作队列将被用来存储需要执行的渲染任务，确保任务按照正确的顺序执行。
指针和内存管理：
在处理这些工作队列时，需要确保正确管理内存和指针。平台层通过引用指针的方式来管理队列的调用，并且保证在调用回调函数时，队列指针能够正确地指向渲染队列的内存地址。
函数回调机制：
为了能够在平台层与工作队列之间进行通信，使用了函数回调的机制。每个任务在添加到工作队列时，都会指定一个回调函数以及相关数据。这个回调函数会在合适的时机被平台层调用，来执行具体的任务。
全局变量或临时解决方案：
在平台层和工作队列的交互中，可能会使用一些临时的全局变量或者其他机制来进行状态的共享。虽然这样做可能使代码变得不太透明，但可以简化实现。在某些情况下，直接使用全局变量来保存平台层的状态是一个快速解决方案。
盲调用平台层：
另一种思路是让平台层能够动态地访问工作队列，而不需要通过显式的参数传递。可以通过让平台层通过一些形式的全局变量或其他机制找到工作队列的位置，从而执行相关任务。这种做法的优点是可以减少平台层和渲染层之间的紧耦合，使得系统的扩展性更强。
编译和调试：
在实现这些功能时，可能需要进行一系列的编译和调试，确保在不同平台上都能够正确地访问和操作工作队列。由于此部分的代码可能会因为依赖于平台特定的实现而有所不同，需要确保每个平台上的代码都能按预期工作。
未来的改进方向：
目前的实现方案可能会稍显繁琐或不够清晰，但其优势在于灵活性。在后续的开发中，可以根据需要进一步优化平台层和工作队列的交互方式，使得代码结构更加简洁和高效。

总结：

本次讨论的核心是如何在平台层实现工作队列，并通过回调机制管理渲染任务的执行。通过合理的指针管理、内存操作和回调机制，可以确保多线程环境下的任务调度得以顺利进行。同时，还探讨了通过使用全局变量或临时方案来简化平台层和工作队列的交互。虽然这种方法目前可以解决问题，但在未来的开发中，可能会进一步优化以提升系统的清晰度和可维护性。
在这里插入图片描述

在这里插入图片描述

为 AddEntry 和 CompleteAllWork 定义全局宏

在这里插入图片描述

这段讨论的主要内容是关于如何在平台层定义全局函数指针，允许游戏层通过这些指针调用平台相关的功能。以下是详细的总结：

主要步骤和内容：

全局定义平台相关函数：
在 game.h 文件中，将定义两个全局变量，用于存储平台层的函数指针。这些函数指针分别是：
- platform_add_entry：用于添加任务到工作队列的函数指针。
- platform_complate_all_work：用于完成所有工作的函数指针。
全局变量的作用和定义：
这两个函数指针会在游戏层初始化时被设置。由于这些函数指针是全局定义的，它们可以被整个程序中的任何地方使用，但它们只有在初始化时才会被赋值。这样做是为了确保在程序运行时，平台相关的操作能够被正确调用，并且避免在运行时出现未初始化或错误的函数指针。
函数指针的管理：
在实现中，这些函数指针会作为平台层服务的一部分，通过平台层传递给游戏层。游戏层在启动时会通过特定的结构体或初始化函数来传递这些函数指针，确保在后续的调用中，平台层的功能可以被正常访问。
类型定义（typedef）：
需要对这两个函数指针类型进行类型定义（typedef），使得代码更加清晰和易于维护。这意味着要为这两个平台层的函数指针定义一个简明的类型别名，以便在程序中引用时更加方便。
没有隐式绑定：
这种设计不依赖操作系统的隐式绑定机制，而是通过显式地传递函数指针来调用平台层的服务。所有平台相关的服务都会在程序启动时通过传递给游戏层的方式来初始化，而不会通过操作系统或其他隐式方式进行绑定。
结构化设计：
这种设计方式有助于保持平台层和游戏层的分离，并且确保平台服务在启动时被正确传递。通过这种结构，平台层的功能可以在需要的时候被调用，而无需操作系统提供任何额外的绑定支持。

总结：

这段讨论的关键点在于如何通过全局函数指针将平台层的服务传递给游戏层。通过在 game.h 文件中定义 platform_add_entry 和 platform_complete_all_work 这两个函数指针，游戏层可以在初始化时正确地将平台相关功能传递给游戏逻辑。这个设计确保了平台层和游戏层之间的清晰分离，并且避免了操作系统的隐式绑定机制，使得平台层的功能可以通过显式的接口进行访问和管理。

为工作队列类型定义 typedef

在这里插入图片描述

这段讨论主要涉及到如何设计和实现平台层的工作队列和回调机制。以下是详细的中文总结：

关键步骤和内容：

平台工作队列回调机制：
在平台层设计时，定义了一个平台工作队列回调（platform_work_queue_callback）。该回调函数包含了两个主要参数：
- 一个指向工作队列的指针，允许在平台层与工作队列进行交互。
- 一个void*类型的指针，作为回调函数的数据参数，用来传递任意的数据。
使用 typedef 定义类型：
为了清晰和方便，定义了typedef来表示平台工作队列回调类型。这样做的目的是让平台代码和游戏层代码在处理工作队列时更加简洁和可读。
函数指针和工作队列：
在函数设计中，platform_add_entry和platform_complete_all_work是两个主要的操作接口。platform_add_entry接受一个工作队列回调和一个void*数据指针，而platform_complete_all_work则与工作队列的完成操作相关。
优先级队列的设计：
在设计工作队列时，考虑了优先级队列的可能性。虽然当前尚未明确决定是否要实现优先级队列，但讨论中提到，可能会根据未来的需求将工作队列分为高优先级队列和低优先级队列。这样可以确保不同优先级的任务能够被合理地调度和处理。
避免无效的数据同步：
讨论中提到，需要避免工作队列在操作时出现不必要的“栅栏”或同步问题。为此，确保平台层每次操作都是对特定队列的明确引用，避免混淆不同队列的操作。
函数命名规范：
讨论中建议对函数进行适当的命名，以便能清晰地区分不同平台操作函数的作用。例如，平台的“完成所有工作”函数应命名为platform_complete_all_work，并且确保函数能够清楚地表达其功能。
未来的扩展性：
设计时考虑了未来扩展的可能性。比如，可以为平台层添加多个工作队列，未来可能会根据需要引入更多的工作队列类型（例如高优先级队列和低优先级队列）。这些扩展会使系统在应对不同任务优先级时更加灵活。

总结：

整个设计主要集中在如何通过平台层的函数指针和回调机制来管理和操作工作队列。平台层定义了必要的函数回调，游戏层通过传递这些回调函数来完成任务。当前设计没有涉及到复杂的同步机制，但考虑到了未来可能需要的优先级队列和扩展。设计的目标是确保队列操作的清晰和高效，并且能够在未来根据需要进行灵活的扩展。

优化多线程 API

这段讨论涉及到如何优化和重构线程池中的工作队列操作，特别是如何通过结构化代码，使得多个线程可以共享相同的工作队列操作，同时保证线程间的同步和正确的任务分配。以下是详细的中文总结：

关键步骤和内容：

线程和工作队列的重构：
- 需要将现有的代码（比如线程处理函数thread_proc）重新构建，使其适应当前的设计要求。目标是确保线程能够从工作队列中获取任务，并在完成任务后继续处理队列中的其他任务，直到所有工作完成。
简化的工作队列执行：
- 在实现中，工作队列的处理方式被简化为一个循环，线程会不断从队列中取出任务并执行，直到队列为空。通过这种方式，工作线程会不停地尝试从队列中获取任务，而不需要复杂的同步机制。
- 工作队列中的任务会通过Win32DoNextWorkQueueEntry函数来处理，工作线程会持续检查队列，直到队列中没有更多的任务。对于非工作线程来说，如果当前没有任务可做，它们会进入休眠状态，等待下一次工作队列的任务。
工作队列的入口函数与完成检查：
- Win32CompleteAllWork函数用于处理队列中的所有任务，直到所有任务完成。通过简单的条件判断，当队列中还有任务时，线程会持续执行任务。
- 通过将任务检查与执行部分提取到Win32DoNextWorkQueueEntry函数中，简化了代码结构，使得工作线程和其他线程的行为更加一致和简洁。
改进的代码结构与清理：
- 通过重构，去除了冗余的代码逻辑，例如不再需要使用interlocked increment来处理任务的完成计数。所有任务完成的标志和同步操作都通过更简洁的方式来实现。
- 对于每个工作队列的任务条目，进行了适当的结构化和命名。工作队列条目的处理变得更加直接和明确，不再需要复杂的同步机制。
多队列支持的可能性：
- 在当前设计的基础上，未来可以扩展为支持多个工作队列，比如高优先级队列和低优先级队列。可以通过修改Win32DoNextWorkQueueEntry来支持从多个队列中选择任务，确保高优先级的任务先被执行。
通过使用示例代码反思设计：
- 在设计过程中，遇到问题时可以通过查看使用代码来帮助理解和修正设计问题。使用代码不仅可以作为设计的指南，还能帮助开发者意识到代码中潜在的简化和优化空间。开发者表示自己通过编写使用代码，进一步确认了自己的设计方向和选择。
代码清理与命名规范：
- 通过对工作队列条目和任务处理函数的重命名，代码变得更加清晰易懂。例如，将work_queue_entry命名为platform_work_queue_entry，确保每个部分的名称准确表达其功能。

总结：

整体来说，这段讨论展示了如何通过简化和重构代码来优化工作队列的执行流程，使得工作线程和非工作线程的行为更加一致和高效。同时，通过设计上的一些扩展，未来可以支持更多复杂的功能，如多队列支持和优先级调度。通过在实际使用中反思设计并逐步调整，最终达到了一个简洁而有效的工作队列管理系统。
在这里插入图片描述

重新开始编译

这段讨论的重点是如何修复和优化平台工作队列的代码结构。具体来说，涉及到如何定义、传递和使用工作队列及其回调函数。以下是详细的中文总结：

关键步骤和内容：

平台工作队列条目的定义：
- 平台工作队列条目（platform_work_queue）的定义已经接近完成，需要修复一些小问题才能成功编译。主要问题是关于类型定义（typedef）的正确性。
- 需要确保 platform_work_queue 和 platform_work_queue_callback 类型在代码中正确使用，并且所有相关的回调函数都能正确匹配这些类型。
类型定义和宏的使用：
- 为了简化类型定义，使用了宏来生成回调函数的类型定义。尽管某些人不喜欢使用宏，但在这种情况下使用宏能够使代码更加简洁，并减少重复的代码编写。
- 使用宏后，能够快速创建如 platform_work_queue_callback 这样的类型定义，并确保在代码中使用这些类型时保持一致性。
传递队列和回调函数：
- 在代码中，platform_add_entry 和 platform_complete_all_work 需要正确传递队列和回调函数。需要确保这些函数能够接受队列（如 RenderQueue）和相关数据，并执行预期的操作。
- 为了实现这一点，需要确保 RenderQueue 在游戏的transient_state中正确传递和使用。通过将队列存储在游戏的临时状态中，可以方便地在不同的地方使用。
在游戏状态中存储渲染队列：
- 需要在游戏的状态中存储渲染队列（RenderQueue），并确保在不同的上下文中都能访问到这个队列。可以将渲染队列放置在临时状态（transient_state）中，这样可以在不干扰主游戏状态的情况下，方便地传递和访问。
- 在代码中，使用 transient_state 存储渲染队列，确保渲染相关的任务和数据都能通过这个队列进行管理。
修复错误和编译问题：
- 修复了一些编译时的错误，确保平台的工作队列条目和回调函数能够正确传递和使用。通过检查和修正类型定义，解决了无法转换参数类型的问题，使得代码能够顺利编译。
- 通过调整代码结构，消除了之前的一些冗余和不必要的部分，使得代码更加简洁。
整理和优化代码结构：
- 在代码重构过程中，整理了许多细节，包括正确地传递渲染队列和回调函数，以及确保每个部分都能清晰地定义和调用。通过这些优化，代码的可读性和可维护性得到了提升。
- 删除了一些不必要的中间变量和冗余代码，使得结构更加清晰。
未来的扩展：
- 提到未来可能会扩展为支持更多类型的工作队列，例如高优先级队列和低优先级队列，以便更灵活地管理不同类型的任务。
- 可以通过扩展和调整代码，使得工作队列能够在不同的上下文中根据需要选择执行优先级更高的任务，确保系统的高效性。

总结：

这段讨论的核心内容是如何通过合理的代码组织和类型定义，使平台工作队列能够正确地处理回调函数并传递数据。通过修复编译时的问题和优化代码结构，最终实现了更简洁、可维护的工作队列系统。此外，提到了如何在未来扩展这个系统以支持更多功能，如多队列支持和优先级调度。

在这里插入图片描述

游戏启动时初始化指针

这段内容描述了初始化和配置工作队列和相关状态的过程。具体的步骤如下：

初始化检查：
- 首先检查是否已经初始化。如果没有初始化，接下来会执行一些设置。
配置回调函数：
- 在未初始化的情况下，需要设置 PlatformAddEntry，其值应该等于 Memory->PlatformAddEntry PlatformCompleteAllWork = Memory->PlatformComplateAllWork，这两个函数是用于平台工作队列的关键函数。确保这两个函数在初始化时正确地被赋值。
初始化临时状态（transient state）：
- 在初始化临时状态时，确保将 RenderQueue 正确地赋值给临时状态中的 TranState->RenderQueue。这确保了渲染队列在不同的状态中得到了正确的初始化。
确保一致性：
- 将 Memory->HighPriorityQueue 赋值给临时状态中的渲染队列（RenderQueue），从而确保在后续操作中能够正确访问渲染队列。
整理剩余部分：
- 最后，整理并完成其他配置部分，确保初始化工作能够顺利完成。

在这里插入图片描述

继续清理工作

在这段内容中，主要涉及了工作队列的执行逻辑和线程调度机制的实现。具体内容可以分为以下几个部分：

线程调度与睡眠判断：
- 在执行 Win32DoNextWorkQueueEntry 时，首先会使用“互锁比较交换”来判断是否有需要执行的工作项。接着，检查队列状态，如果当前没有工作项，则判断是否应该让线程休眠。
- 线程休眠的条件是当队列的工作项计数与预期相等时，意味着队列为空，线程可以休眠，否则线程会继续尝试处理队列中的任务。
工作项处理：
- 一旦判断出有工作项需要执行，代码会从队列中取出相应的工作项并执行。在执行时，特别强调了需要使用“读写屏障”（read-write barrier）来确保在执行工作项之前，所有先前的写操作已被提交。这是为了保证数据的完整性和一致性，尽管根据 Interlocked Increment 的实现，它已经自动处理了屏障问题，因此在这种情况下不再需要手动添加屏障。
回调执行：
- 在成功处理完队列中的工作项后，回调函数会被调用，并将队列和数据传递给回调函数进行后续处理。此时，系统将确保工作项的正确处理，并不会引入多余的等待或资源竞争。
测试与调试：
- 在测试过程中，DoWorkerWork 函数会接受一个 void* 类型的参数，该参数代表了工作项的相关数据。此数据会在回调时传递给相应的函数。为了方便调试，代码中会打印出相关的线程信息和调试数据，但由于线程索引的获取问题，可能需要对现有的线程模型做出适当的调整。
宏与简化：
- 在一些地方使用了宏来简化代码，特别是对于类型定义和工作队列的处理。通过宏，可以避免重复编写冗长的代码，并确保代码的一致性和可维护性。
后续步骤：
- 完成了这些操作后，接下来需要确保修复和完善测试代码，确保所有功能正常工作。在测试时，虽然线程索引可能无法直接获取，但可以通过将其作为参数传递给回调来解决这一问题，从而简化调试过程。

总结来说，内容涉及了如何通过细致的线程调度和工作队列管理来实现高效的任务处理，确保系统在多线程环境下的正确性和性能。同时，通过适当的宏和调试手段，简化了代码并提高了开发效率。

获取当前线程的 ID，以便在调试过程中能够知道是哪一个线程在执行。通过调用 GetCurrentThreadId() 来获得当前线程的 ID，这样可以在调试输出中看到具体是哪个线程正在进行任务处理。这和之前使用的线程编号不同，因为操作系统为每个线程分配的 ID 会有所不同。

接下来，系统进行了调整，将 Win32AddEntry 中的原始字符串替换成了直接调用 Win32AddEntry 函数，简化了之前的结构。此时，Win32AddEntry 直接处理回调函数 DoWorkerWork，不再需要复杂的手动推送字符串，只需传递回调函数和数据。

此外，工作队列的名称从原来的 WorkQueue 更新为 PlatformWorkQueue，并且 Win32AddEntry 函数的定义也发生了变化，需要传入一个回调函数（例如 DoWorkerWork）。这样，任务处理变得更加直接且易于管理。

在 Win32CompleteAllWork 中，队列被传递到函数中进行处理，确保队列中的所有工作项都被完成。这些更改和调整使得代码变得更加简洁和清晰。

最后，由于进行了大量的修改和调整，建议通过调试器逐步执行代码，确保每个步骤的正确性，特别是对工作队列和任务处理流程的修改，能够按预期工作。

在这里插入图片描述

先注释掉渲染部分看看结果
在这里插入图片描述

在这里插入图片描述

@startuml

' Define participants
actor "WinMain" as Main
participant "platform_work_queue" as Queue
participant "win32_thread_info" as ThreadInfo
participant "CreateAndRunWorkerThread" as Thread
participant "Win32DoNextWorkQueueEntry" as DoNext
participant "DoWorkerWork" as Worker
participant "Win32AddEntry" as AddEntry
participant "Win32CompleteAllWork" as Complete

' Sequence of interactions
Main -> Queue: Initialize (SemaphoreHandle, Entries[])
Main -> ThreadInfo: Initialize (Queue refs, ThreadCount=7)

' Create threads and put them to sleep
loop For each thread (0 to 6)
    Main -> Thread: CreateAndRunWorkerThread(ThreadInfo)
    Thread -> DoNext: Win32DoNextWorkQueueEntry(Queue)
    DoNext -> Thread: No tasks, WaitForSingleObjectEx(SemaphoreHandle) // Sleep
end

' Adding tasks to the queue
loop For each string (e.g., "String A0" to "String B8")
    Main -> AddEntry: Win32AddEntry(Queue, DoWorkerWork, "String X")
    AddEntry -> Queue: Add task to Entries[EntryCount]
    AddEntry -> Queue: ReleaseSemaphore() // Wake one sleeping thread
    Thread -> DoNext: Resume from sleep, Win32DoNextWorkQueueEntry(Queue)
    DoNext -> Worker: Callback(Queue, "String X")
    Worker -> : OutputDebugStringA("Thread ID, String X")
    DoNext -> Queue: InterlockedIncrement(EntryCompletionCount)
end

' Thread returns to sleep if no more tasks
Thread -> DoNext: Win32DoNextWorkQueueEntry(Queue)
DoNext -> Thread: No tasks, WaitForSingleObjectEx(SemaphoreHandle) // Back to sleep

' Completing all work
Main -> Complete: Win32CompleteAllWork(Queue)
loop EntryCount != EntryCompletionCount
    Complete -> DoNext: Win32DoNextWorkQueueEntry(Queue)
    DoNext -> Worker: Execute remaining tasks
    DoNext -> Queue: Update EntryCompletionCount
end
Complete -> Queue: Reset EntryCount & EntryCompletionCount

' End
Main --> : Exit

@enduml

在这里插入图片描述

审查/检查错误

在进行初始化时，需要确保在调用任何函数之前，正确设置必要的值。具体来说，在设置游戏内存时，初始化代码需要包括一些关键的设置项。例如：

提供一个高优先级队列：在初始化时，必须确保队列的正确性，以便能够支持任务的高优先级处理。
设置平台的 AddEntry 和 CompleteAllWork 函数：在初始化时，还需要确保这些平台级函数已经被适当设置，以便能够向工作队列中添加任务并完成所有工作。

此外，需要确保所有这些设置项在初始化时都被正确配置，这样就能保证整个工作队列的功能能够顺利运行。通过这些调整，初始化过程将能够为任务处理提供正确的环境。

最后，虽然在设置过程中使用了一个队列变量 q，但目前遇到的问题是：这个队列还没有完全准备好使用，可能需要进一步的处理和检查，以确保队列的状态符合预期。
在这里插入图片描述

在这里插入图片描述

问题：队列永远不会重置

目前队列的设计中，队列并没有被重置。这种情况虽然暂时有效，但并不是最终期望的实现方式。为了暂时解决这个问题，可以采取某种措施使队列在某些情况下进行清空或重置，但这并不是最终的解决方案。在未来的版本中，队列的重置方式需要重新设计，以确保其更符合预期的行为和使用需求。

临时修复：所有工作完成后重置队列

在队列中的所有任务完成后，需要进行队列的重置操作。具体来说，当所有任务完成时，可以重置队列的相关参数，包括释放计数、下一个待处理的任务索引等。这是为了确保队列状态的清理和后续工作顺利进行。

在当前实现中，尽管程序看起来正常运行且线程能够按预期打印输出，但是仍然有一些问题需要解决。例如，程序的某些部分可能在预期之外运行，没有出现错误，甚至看似游戏成功启动并运行。这种行为令人困惑，因为预期中某些部分应该会失败，导致程序崩溃，但实际上并没有发生。这表明可能存在某些未被发现的潜在问题。

虽然当前代码在一定程度上工作正常，线程能够顺利执行并打印出结果，但仍有很多待改进的地方，程序并没有完全达到预期效果。因此，需要对代码进行清理和修复，确保线程安全，并解决可能的并发问题。

在调试过程中，首先会着手解决数据结构的实现问题，考虑将当前的数据结构转换为环形缓冲区，以减少可能的错误并简化后续的调试工作。通过这种方式，可以集中精力调试单一问题，而不是一次解决多个问题。同时，目前的实现并不保证线程安全，可能会因为线程间的交替执行而导致错误。因此，在开始调试之前，应该先确保程序能够正确地处理线程同步问题。
在这里插入图片描述

在这里插入图片描述

将队列改为循环缓冲区

为了将当前的队列转换为环形缓冲区，首先需要对数据结构进行一些调整。目的是让数据可以在缓冲区中循环读取和写入，因此需要设置读取和写入位置，并在它们之间保持一个完成标记。这样做的核心在于确保读取和写入的位置能够正确地“环绕”并重新开始。

首先，考虑到环形缓冲区的特性，可以通过修改现有的队列结构，使用两个位置来表示写入和读取的地方，进而实现数据的循环使用。具体来说，可以采用互锁比较交换操作（InterlockedCompareExchange）来处理缓冲区的写入和读取操作，确保在多线程环境下的安全性。

为了实现这个目标，队列中的某些字段将被重新命名以适应新的结构。比如，原本的EntryCompletionCount可以改名为FirstUnCompletedEntry(next entry to complete)，表示下一个完成的任务；NextEntryToWrite表示下一个待填充的任务，而NextEntryToRead则表示下一个待读取的任务。这样，队列中的数据可以按顺序循环使用，并确保数据在队列中不会丢失或被覆盖。

在添加新任务时，需要确保写入位置不会覆盖尚未处理的任务。为此，可以使用断言来验证当前的写入位置是否与读取位置相同。如果相同，说明缓冲区已满，不能再进行写入操作。

然而，这一过程中需要考虑到如何处理环绕（wrap around）的问题，即写入位置到达缓冲区末尾时，如何重新从缓冲区的起始位置继续写入。在这种情况下，可以通过互锁操作保证不会发生数据冲突，确保多线程环境下写入操作的正确性。

总的来说，这个过程涉及到对队列结构的重新设计和线程同步机制的完善，以便能够高效、安全地处理环形缓冲区中的数据。虽然环形缓冲区的实现相对复杂，但通过合理使用互锁操作和适当的同步机制，可以确保其在多线程环境中的稳定性。
在这里插入图片描述

在这里插入图片描述

Blackboard: 循环 FIFO

在考虑如何处理循环缓冲区的写入和读取时，核心思想是确保写入指针和读取指针能够正确地交替移动，避免出现冲突或覆盖。以下是循环缓冲区的一些重要考虑：

读写指针的管理：循环缓冲区的关键在于管理好读指针和写指针的位置。每次写入数据时，写指针向前移动，而读取数据时，读指针向前移动。
防止写指针与读指针冲突：写指针和读指针有可能相遇，如果写指针超过读指针，意味着写入数据会覆盖掉未读的数据，造成数据丢失。因此，在写入新数据之前，必须确保写指针不会超过读指针。如果下一次写入的位置会与读指针重叠，则说明缓冲区已经满了，不能继续写入。
判断缓冲区是否已满：可以通过比较写指针和读指针的位置来判断缓冲区是否已满。一个常见的做法是，如果下一次写入位置等于读指针的位置（即写指针 + 1 == 读指针位置），则说明缓冲区已满，不能继续写入。
避免溢出：为了避免发生溢出，必须添加一个条件判断，确保在每次写入数据时，写指针不会环绕到读指针之前。如果发生这种情况，写操作会被拒绝，提示缓冲区溢出。
空间的管理：通过这种方式，循环缓冲区可以有效地管理数据的写入和读取过程，确保系统在多线程环境中不发生数据丢失或覆盖。

总结来说，循环缓冲区的管理涉及确保写入和读取操作不会发生冲突，并且保证在多线程环境中数据的安全性与一致性。

实现 FIFO 队列

在设计和实现循环缓冲区的过程中，以下几个关键步骤和思路被逐步考虑并执行：

写入指针和读指针管理：循环缓冲区需要管理写入和读取的位置。写入指针（NextEntryToWrite）和读取指针（NextEntryToRead）是关键。每次写入新数据时，写入指针向前移动，而每次读取数据时，读取指针向前移动。
避免写入冲突：为了避免写入数据时覆盖未读取的数据，需要确保写入指针不会与读取指针重合。特别是，如果写入指针即将越过读取指针，必须停止写入，并抛出溢出错误。这可以通过检查写入指针是否等于读取指针来实现。
循环缓冲区溢出检测：为了避免写入溢出缓冲区，设计了一个条件判断逻辑：如果写入指针加一等于读取指针的位置，则认为缓冲区已满，不能再继续写入。
写指针回绕机制：当写入指针到达缓冲区的末尾时，它应当回绕到缓冲区的起始位置。通过判断写入指针加一是否等于缓冲区的大小，来决定是否需要回绕到零。
任务完成计数：每个任务或工作项都需要有一个单独的完成计数器，用来跟踪每个任务的进度。通过CompletionCount来记录每个任务的完成情况，当任务完成时，可以更新计数器，并检查是否所有任务都完成。
目标完成计数：每次添加一个任务时，都会增加一个目标完成计数（CompletionGoal）。通过与实际的CompletionCount进行比较，判断任务是否已完成。循环继续执行，直到所有任务完成。
多个完成计数器：为了处理多个任务的完成情况，需要为每个任务设置一个独立的完成计数器。这些计数器将用来判断一个批次任务是否完成。

总之，设计循环缓冲区时，考虑了数据的安全写入与读取，通过指针管理、缓冲区溢出检查和任务完成追踪等措施，确保了系统的稳定性与可靠性。
在这里插入图片描述

测试 FIFO 队列

在进行循环缓冲区的实现和调试时，发现部分功能未按预期工作，尤其是在缓冲区的“回绕”功能上。虽然某些部分看起来正常，其他部分却出现了问题，尤其是回绕部分没有如预期那样运作。具体来说，遇到的主要问题是循环缓冲区的回绕没有正确地将指针重新设置到缓冲区的起始位置。

因此，接下来的重点是测试缓冲区回绕部分的功能。目的是确保写入指针和读取指针在到达缓冲区的边界时能够正确回绕，避免指针越界或发生错误的写入/读取操作。

调试 FIFO 环绕问题

在这里插入图片描述

多线程渲染正常工作！

问题已经解决，程序现在成功地在多线程环境中进行渲染。虽然在处理器的使用率上有所提升，使用了比之前更多的计算资源，但我们并没有将其推到最大，因为这是故意设计的。总体上，CPU的使用率大约增加了三倍，但考虑到渲染的目标帧率是每秒30帧，这个性能提升已经足够。由于程序在渲染过程中会等待垂直同步等操作，因此无法进一步提高渲染速度。

在测试过程中，发现我们仍然渲染的帧率保持在30帧每秒，并且已经有了显著的性能提升。接下来的任务是优化一些细节，例如处理图块的设置以及如何正确处理边缘情况。尽管这些问题在多线程之前并不明显，但在多线程环境下变得更加突出。

另外，关于分辨率的测试，尝试将分辨率设置为1920x1080，虽然比之前慢，但依然能保持较高的帧率，这意味着程序已经能够在更高分辨率下正常运行。最终，程序的表现相当不错，甚至达到了可以接受的帧率。考虑到之前在较小分辨率下性能非常低下，这种变化可以说是非常令人惊讶和兴奋的。

目前，程序已经可以在更高分辨率下流畅运行，并且正在接近完成。接下来的工作将包括处理一些细节问题，并进一步优化性能。尽管还未完全完成，但程序已经展现出非常强的潜力，令人感到非常兴奋。
在这里插入图片描述

由于工作负载无法按顺序完成，如果有一个工作负载运行非常长时间，而其他线程在队列中循环，这时一个新的工作负载是否会覆盖仍在运行的工作负载所在的槽？

在处理工作负载时，可能会遇到一个问题：如果一个任务需要较长时间才能完成，而其他线程在队列中环绕时，新的任务可能会覆盖掉仍在运行的任务。这显然是一个问题，因此需要考虑如何解决。

通常解决此问题的方法是限制队列中任务的数量，以避免发生覆盖现象。具体而言，可以通过为渲染操作设置一个高优先级队列，确保队列中始终有足够的空间来存储完整的渲染任务集合，这样就不会发生新任务覆盖未完成任务的情况。

对于像背景加载这样的低优先级任务，可以使用一个单独的队列，并在队列接近满时停止启动新的资产加载任务，从而避免由于队列已满而导致的任务覆盖。这种方法相对简单，也可以有效地避免出现覆盖问题。

为了实现这一点，可以在 Win32AddEntry 函数中添加一个返回值，表示是否成功将任务添加到队列。如果返回失败，调用代码就可以知道队列已经满了，从而停止发起新的后台加载任务。这种方式可以保证高优先级任务（如渲染任务）不会被低优先级任务覆盖。

既然我们已经实现了多线程，能否在调试模式下编译，并且游戏仍然能以合理的帧率运行？

在切换到多线程模式后，经过编译和调试，游戏在调试版本下能够以合理的帧率运行，甚至在1920x1080分辨率下也能实时渲染。虽然没有启用优化，并且只使用了8个线程，但性能已经非常不错。尽管目前没有开启地面块的渲染，并且位图的大小有些不必要的过大，渲染和显示的效果仍然非常流畅，显示了整个屏幕并且正确地显示了树木和角色。

尽管目前没有启用完整的复杂性和图形处理，例如没有进行子像素精度处理，也没有进行位图裁剪，游戏的基本功能已经能够在没有依赖图形卡的情况下实现实时渲染，使用的只是图形卡的帧缓冲。这种技术展示令人非常激动，感觉像是自己亲自创造了一部分，达到了自己预期的目标。

虽然这不是一些突破性的技术创新，而只是实现了基础的多线程渲染和图形处理，但能够亲手做出这些功能，看到它们顺利运行，确实非常满足和自豪。通过这一过程，不仅完成了任务，还增强了对游戏开发流程的掌控感。与传统的购买现成技术、仅仅依赖他人工作不同，这种亲自实现的过程让整个经历更加有意义。

在这里插入图片描述

我们现在能看出它多线程后快了多少吗？

现在在启用多线程后，帧率有了显著的提升。虽然希望今天能早点完成以便进行性能对比，但即使如此，也可以看到通过启用多线程，性能有了明显的改善。为了进一步测量性能，可以启用旧的性能计数器来监控每帧的渲染时间，当前的帧时间大约是33毫秒，这个性能表现相当出色。

接着，进行了一些测试，关闭多线程后，帧时间变得明显更高。关闭多线程时，程序的渲染时间变得较长，尽管性能还算不错，但与启用多线程时相比，帧率明显下降。这个测试表明多线程对性能提升有显著作用，尤其是在渲染时，能够有效减少每帧所需的时间。

此外，还通过调整目标帧率和刷新率进一步测试了性能。当设置目标帧率为60时，程序的表现有所提升，帧率达到了50，但并未达到预期的60帧每秒。这表明，虽然性能有所改进，但可能由于一些限制，无法完全达到60帧的目标。

如果继续启用多线程，可能会进一步提升性能，但为了更精确地评估性能，建议通过计时工具来测量每个任务的执行时间，这样能更好地了解哪些部分影响了帧率。但由于时间的限制，这部分测试未能完成。

总体来说，多线程显著提升了游戏的帧率，尤其是在较高的分辨率下，性能的提升更加明显。虽然仍有一些改进空间，但目前的表现已经非常令人满意。

如果在添加条目时断言队列不会溢出，是否更好在没有空间写入时等待某个条目被读取？

如果在向队列添加条目时，队列没有足够空间，最好的做法是等待一个条目被读取，再进行写入，而不是简单地断言队列不会溢出。虽然这么做会避免队列溢出的风险，但我不太喜欢这样做，因为这可能会导致游戏在帧的处理中被阻塞。因此，我更倾向于尽可能保持常数时间的插入操作，避免引入任何可能的延迟。

你会称这个为线程池吗？

我不确定这是否能算作线程池。事实上，我从来没有读过别人怎么定义线程池，但它确实有点像线程池的工作方式。

在调试多线程代码时，所有其他线程也会停止吗？

在调试多线程代码时，所有线程通常会一起停止。虽然我不确定是否可以单独控制某些线程的暂停与继续，但我知道在调试时可以冻结和解冻线程。当进入调试器并断点停止时，可以选择暂停某个线程，或者让它继续执行。具体来说，可能无法在一个进程中让某些线程继续运行，而其他线程停止，通常情况下，整个进程会停下来。对于是否能单独控制每个线程的暂停和恢复，可能需要进一步确认。

能否将线程数作为游戏中的配置选项？

我不确定是否会把线程数作为一个游戏内配置选项，但我们会让线程数根据处理器的核心数量来决定。这意味着，游戏将根据处理器的线程数来自动调整，而不是手动设置。

渲染器何时能完成？

目前并不关心渲染排序的问题，排序虽然也很重要，但更关心其他方面的工作。我认为其他的功能完成才是优先事项，至于排序，之后有时间可以再去处理。

你更改了 if 条件后，WeShouldSleep 还是正确的吗？

在多线程编程中，代码即使能够正常运行，也并不意味着没有错误。多线程的复杂性可能导致一些错误在长期运行中隐藏，直到某个特定的线程交互条件触发，才会暴露出来。因此，单纯通过代码运行是否顺利来判断其正确性是不可靠的。

在多线程的环境下，多个线程的操作是并发进行的，这意味着它们的执行顺序是不可预测的。每个线程的执行时间和行为可能会影响其他线程的状态，这种不可预测性使得错误的出现时机往往难以提前发现。所以即便代码看起来没有报错，也有可能存在潜在的bug，直到某些特定条件被满足，错误才会暴露出来。

当我们在处理队列操作时，设置一个标志（例如 WeShouldSleep）为 false，表示默认情况下我们会继续尝试做一些操作。我们首先检查队列中下一个要读取的元素是否存在。如果存在，说明队列中没有空的元素，我们就会尝试进行某些操作。如果队列为空，标志 WeShouldSleep 会被设置为 true，此时我们会暂停操作，等待其他线程来处理数据。

但是，如果我们在尝试进行队列操作时发现队列无法成功地出队（dqueue）一个元素，可能是因为其他线程已经抢先进行了操作。这时，我们无法确定队列中是否还有数据可供处理，因此需要重新进入处理逻辑，再次检查队列状态。

具体来说，代码会做一个检查，如果队列为空，则会触发休眠操作；如果队列不为空，则会继续执行其他任务，并且会重新检查队列的状态。这个过程会不断重复，直到队列中的状态变化符合预期或者线程操作能够成功完成。

总的来说，尽管代码在某些情况下看似没有问题，但由于多线程环境下可能存在的复杂交互，仍然建议定期检查代码逻辑，确保在不同线程交替执行时，所有的潜在问题都能够被发现并解决。
在这里插入图片描述

为什么你使用 #if 0 而不是 // 或 /*？

使用 #if 0 而不是传统的注释（如 #）的主要原因在于它能够灵活地启用和禁用代码段。这种做法的好处是可以通过简单地修改一个字符来控制代码块的启用或禁用，从而实现动态的调试和测试。比如，使用 #if 0 可以轻松地注释掉一段代码，而如果需要重新启用这段代码，只需将 0 改为 1 或移除 #if 0 语句。

另外，#if 0 语句的另一个优势是它的“嵌套”功能。不同于传统的注释，#if 0 可以正确地嵌套在其他代码块中。当有多个代码段需要注释时，如果用传统的注释符号（如 #）来注释一段已经注释过的代码，可能会导致注释嵌套不正确，进而产生错误。例如，当想要注释一段已经注释的代码时，普通的注释可能会造成原先注释代码的不完全注释，导致语法错误。而 #if 0 的嵌套效果良好，可以避免这种问题。

因此，使用 #if 0 可以确保代码在注释或禁用时的正确性，并且能够灵活地控制哪些代码需要被执行，哪些不需要，这对于调试和开发过程中的代码管理是非常有帮助的。

能展示 4K 吗？

讨论中提到的问题包括是否能够进行某项操作，但由于只有一个1920x1080的显示器，无法满足进行该操作的条件。

问：多线程代码比单线程代码更不可靠吗？

多线程代码相比单线程代码更不可靠，这种说法是正确的。多线程编程需要处理线程之间的复杂交互和同步问题，因此比单线程代码更容易出错。许多优秀的程序员通常会设计系统，确保多线程的使用是非常严格控制的。因为如果随意地进行多线程编程，让多个线程不受控制地并行执行，很容易引发问题。

虽然有一些非常经验丰富的程序员能够编写出高效的多线程代码，处理多个线程并让它们正常运行，但这种情况并不常见。大多数情况下，过度使用多线程并不意味着代码就能稳定运行。多线程的复杂性使得编写出没有缺陷的多线程程序变得非常具有挑战性。因此，控制多线程的使用，并确保线程之间的交互是安全和高效的，才是最好的做法。

所以循环缓冲区是否在线程处理完一个瓦片后回收线程？我不太明白为什么选择循环缓冲区。

环形缓冲区与线程回收并没有直接关系，环形缓冲区仅仅是作为一个队列存在。选择环形缓冲区的原因在于它能够不断地将元素放入队列中，而不会因为队列满了而阻塞。环形缓冲区的特点是，当队列达到最大容量时，它会覆盖掉最早的元素，以便继续插入新的元素。这样可以确保队列始终能够容纳数据，并且不断地处理这些数据，直到所有任务完成。因此，使用环形缓冲区的目的是为了能够无限制地往队列中添加数据，并且确保数据始终能够被处理，而不会因为队列满了而中断处理流程。

所以循环缓冲区是否在线程处理完一个瓦片后回收线程？我不太明白为什么选择循环缓冲区。

选择环形缓冲区的原因在于希望能够避免人们在处理队列时遇到阻塞或资源浪费的问题。环形缓冲区的设计使得队列可以在达到最大容量后覆盖最旧的元素，这样就可以不断地将新的数据放入队列，而不需要担心队列满了之后的处理问题。因此，环形缓冲区能够确保数据的连续处理，不会因为空间限制而中断程序的执行。

这种设计的另一个优点是，它不需要复杂的内存管理，因为队列的头和尾指针会在缓冲区满时自动循环利用，避免了对内存的过多占用。使用环形缓冲区可以确保系统在高负载下仍然能够高效运行，适合那些需要处理大量数据流的应用场景。

Blackboard: 循环缓冲区

选择环形缓冲区的原因是为了简化代码的理解和管理，避免让开发人员在代码中花费太多时间去思考复杂的实现细节。环形缓冲区的设计可以让队列持续地接受新数据，并异步地处理旧数据。具体来说，数据会被持续地放入队列中，同时从队列中取出需要处理的任务，形成一个不断循环的过程。例如，先放入任务A，然后取出任务A，再放入任务B，接着取出任务B，依此类推。

这种方式的好处在于能够处理需要较长时间才能完成的任务。比如，如果需要在后台进行解压缩等操作，使用环形缓冲区可以让任务在不确定的时间内异步执行。传统的队列可能在任务执行时间不确定时无法有效工作，因为没有办法预测任务何时完成，也没有办法在渲染队列中一次性清除所有任务。

而使用环形缓冲区的优势是，它允许持续不断地向队列中添加任务，同时从队列中取出已经完成的任务，形成一个不断滚动的处理窗口。这样，即使任务的执行时间不一致，也不会造成阻塞或遗漏。环形缓冲区的这种设计特别适合用在像后台艺术创作、解压等需要异步执行且任务执行时间不固定的场景中。

#include <iostream>
#include <vector>
#include <stdexcept>

class CircularBuffer {
private:
    std::vector<int> buffer;  // 存储数据的缓冲区
    int head;  // 队列的头部指针
    int tail;  // 队列的尾部指针
    int count;  // 当前队列中的元素数量
    int size;  // 缓冲区的大小

public:
    CircularBuffer(int size) : size(size), head(0), tail(0), count(0) {
        buffer.resize(size);  // 初始化缓冲区大小
    }

    bool isEmpty() const {
        return count == 0;  // 如果元素数量为 0，队列为空
    }

    bool isFull() const {
        return count == size;  // 如果元素数量达到上限，队列满了
    }

    void enqueue(int item) {
        if (isFull()) {
            std::cout << "Buffer is full, overwriting data." << std::endl;
            // 如果缓冲区满了，覆盖最早的数据
            head = (head + 1) % size;  // 移动头部指针，覆盖最旧的元素
        } else {
            count++;  // 如果缓冲区没有满，元素数量加一
        }

        buffer[tail] = item;  // 将新元素加入到尾部
        tail = (tail + 1) % size;  // 移动尾部指针，确保在环形缓冲区内循环
    }

    int dequeue() {
        if (isEmpty()) {
            throw std::out_of_range("Buffer is empty, nothing to dequeue.");
        }

        int item = buffer[head];  // 获取头部的元素
        head = (head + 1) % size;  // 移动头部指针，指向下一个元素
        count--;  // 元素数量减一
        return item;
    }

    int peek() const {
        if (isEmpty()) {
            throw std::out_of_range("Buffer is empty, nothing to peek.");
        }
        return buffer[head];  // 返回队列头部的元素
    }

    void print() const {
        std::cout << "Buffer: ";
        for (int i = 0; i < size; i++) {
            std::cout << buffer[i] << " ";
        }
        std::cout << ", Head: " << head << ", Tail: " << tail << ", Count: " << count << std::endl;
    }
};

int main() {
    CircularBuffer buffer(5);  // 创建一个大小为 5 的环形缓冲区

    // 向缓冲区插入数据
    buffer.enqueue(1);
    buffer.enqueue(2);
    buffer.enqueue(3);
    buffer.enqueue(4);
    buffer.enqueue(5);
    buffer.print();

    // 继续插入数据，覆盖最早的元素
    buffer.enqueue(6);
    buffer.enqueue(7);
    buffer.print();

    // 出队操作
    std::cout << "Dequeue: " << buffer.dequeue() << std::endl;  // 出队 1
    buffer.print();

    std::cout << "Dequeue: " << buffer.dequeue() << std::endl;  // 出队 2
    buffer.print();

    // 查看头部元素
    std::cout << "Peek: " << buffer.peek() << std::endl;  // 查看 3

    return 0;
}

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.animation import FuncAnimation
import matplotlib.patches as patches

# 设置支持中文的字体
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

class CircularBuffer:
    def __init__(self, size):
        self.size = size
        self.buffer = [None] * size
        self.write_ptr = 0  # 写指针
        self.read_ptr = 0   # 读指针
        self.full = False
        self.empty = True
        
    def append(self, item):
        if not self.full:  # 只有在缓冲区未满时才写入
            self.buffer[self.write_ptr] = item
            self.write_ptr = (self.write_ptr + 1) % self.size
            self.empty = False
            if self.write_ptr == self.read_ptr:
                self.full = True
            return True  # 写入成功
        return False  # 缓冲区满，写入失败
            
    def read(self):
        if not self.empty:
            value = self.buffer[self.read_ptr]
            self.buffer[self.read_ptr] = None
            self.read_ptr = (self.read_ptr + 1) % self.size
            self.full = False
            if self.read_ptr == self.write_ptr:
                self.empty = True
            return value
        return None

    def get_buffer(self):
        return self.buffer.copy()

# 设置图形
fig, ax = plt.subplots(figsize=(10, 10))
buffer_size = 8
cb = CircularBuffer(buffer_size)

# 创建圆形缓冲区
theta = np.linspace(0, 2*np.pi, buffer_size, endpoint=False)
radius = 1
center = (0, 0)

# 创建扇形区域
wedges = []
for i, angle in enumerate(theta):
    wedge = patches.Wedge(center, radius, np.degrees(angle), 
                         np.degrees(angle + 2*np.pi/buffer_size), 
                         width=0.3, alpha=0.5)
    wedges.append(wedge)
    ax.add_patch(wedge)

# 添加写指针和读指针
write_arrow, = ax.plot([], [], 'g-', lw=2, label='写指针')
read_arrow, = ax.plot([], [], 'r-', lw=2, label='读指针')

# 添加文字说明
status_text = ax.text(-1.5, 1.5, '', fontsize=12)
value_texts = [ax.text(0, 0, '', ha='center', va='center') for _ in range(buffer_size)]

# 设置图形范围和样式
ax.set_xlim(-1.5, 1.5)
ax.set_ylim(-1.5, 1.5)
ax.set_aspect('equal')
ax.axis('off')
ax.legend()
ax.set_title('循环缓冲区演示')

# 用于记录最后一次写入和读取的值
last_written = None
last_read = None

def update(frame):
    global last_written, last_read
    
    # 如果缓冲区满，只读取；否则随机读写
    if cb.full:
        action = 'read'
    elif cb.empty:
        action = 'write'  # 如果缓冲区空了，必须写入
    else:
        action = np.random.choice(['write', 'read'], p=[0.7, 0.3])  # 70%写，30%读
    
    if action == 'write':
        new_value = np.random.randint(1, 100)
        if cb.append(new_value):
            last_written = new_value
            status = f'操作: 写入 {new_value}\n'
        else:
            status = f'操作: 尝试写入 {new_value} 失败（缓冲区满）\n'
    else:  # 读取
        value = cb.read()
        last_read = value
        status = f'操作: 读取 {value if value is not None else "无数据"}\n'
    
    # 更新扇形颜色和值
    current_buffer = cb.get_buffer()
    for i, (wedge, val) in enumerate(zip(wedges, current_buffer)):
        wedge.set_facecolor('blue' if val is not None else 'gray')
        value_texts[i].set_position((0.85 * np.cos(theta[i]), 0.85 * np.sin(theta[i])))
        value_texts[i].set_text(str(val) if val is not None else '')
    
    # 更新写指针
    w_angle = theta[cb.write_ptr]
    write_arrow.set_data([0, radius * np.cos(w_angle)], 
                        [0, radius * np.sin(w_angle)])
    
    # 更新读指针
    r_angle = theta[cb.read_ptr]
    read_arrow.set_data([0, radius * np.cos(r_angle)], 
                       [0, radius * np.sin(r_angle)])
    
    # 更新状态文字，显示最后写入和读取的值
    status += (f'最后写入的值: {last_written if last_written is not None else "无"}\n'
               f'最后读取的值: {last_read if last_read is not None else "无"}\n'
               f'写指针位置: {cb.write_ptr}\n'
               f'读指针位置: {cb.read_ptr}\n'
               f'缓冲区满: {cb.full}\n'
               f'缓冲区空: {cb.empty}')
    status_text.set_text(status)
    
    return wedges + [write_arrow, read_arrow, status_text] + value_texts

# 创建动画
ani = FuncAnimation(fig, update, frames=range(100), interval=1000, 
                   blit=True, cache_frame_data=False)

plt.show()

在这里插入图片描述

我刚看到你在没有工作时让线程休眠，你还在使用信号量来阻塞和唤醒线程吗？还是在让线程休眠？

在多线程编程中，提到了线程在没有工作可做时应该如何处理。并非使用睡眠（sleep）来暂停线程，而是使用信号量（semaphore）来阻塞和唤醒线程。这里澄清了一个常见误解，实际上并没有使用“睡眠”这个术语，因为“睡眠”可能引发不必要的等待时间和资源浪费。

正确的方式是线程在没有任务时会等待某个信号，而不是简单地睡眠等待。通过这种方式，线程能够在没有工作时处于等待状态，当有新的工作或信号到来时，线程会被唤醒并继续执行。这样，线程处于一种高效的等待状态，而不是消耗CPU资源。

总的来说，使用信号量和等待机制来控制线程的执行，避免了不必要的“睡眠”，并确保了系统资源的有效使用。

实现队列作为链表是否更容易？这样就没有最大大小限制了。由于我们不需要遍历列表，它应该依然很快。

在讨论队列的实现时，提出了关于是否使用链表和是否允许队列无界增长的问题。链表有一个固定的最大大小，这个最大值受限于内存的大小。如果每次添加元素时都要重新分配内存，会导致性能开销增大，因为每次入队都需要进行内存分配和复制操作。这样做并没有实际的好处，除非真的需要一个无界的队列。

无界队列的最大优势是没有大小限制，但这也带来了许多问题。比如，如果队列的大小不限制，它可能会无限增长，占用过多的内存，导致系统崩溃或者资源浪费。因此，必须仔细考虑在什么情况下才需要允许队列的大小无限制增长。

从经验来看，几乎没有情况是需要无界队列的。大多数时候，限制队列的大小可以提高系统的效率和稳定性。避免无界队列的做法，能够让其他系统资源的管理更为高效，避免因队列无限增长而导致的负面影响。因此，限制队列的大小，确保其在合理范围内，是更为合适的选择。

在滚动缓冲区中，你会检查每个条目是否已填满，然后再写入新条目，否则跳到下一个槽位吗？

在讨论滚动缓冲区时，提到写入新数据之前是否会检查缓冲区的条目是否已被填充。实际情况是，目前的实现并没有检查条目是否已经被写入，而是直接认为如果在已满的情况下尝试写入数据，就是一个硬错误。也就是说，当尝试在满的缓冲区中写入数据时，系统会将其视为一个错误，直接报告出来。

因此，如果在这种情况下尝试插入数据，系统不会跳过该槽位，而是会出现错误。当前的设计是强制的，任何错误都会被视为重大问题并直接处理。

接下来，可能会进行视频检查工作，以确保视频的质量是否符合预期。

游戏引擎学习第126天

单生产者/多消费者问题

InterlockedCompareExchange

函数原型（C/C++）：

参数解释：

操作过程：

返回值：

使用场景：

示例：

总结：

修复我们的问题

关键操作流程：

总结：

通过 API 更改进一步简化

关键点：

总结：

实现多线程 API

主要步骤和内容：

总结：

通过管道传递工作队列

主要步骤和内容：

总结：

为 AddEntry 和 CompleteAllWork 定义全局宏

主要步骤和内容：

总结：

为工作队列类型定义 typedef

关键步骤和内容：

总结：

优化多线程 API

关键步骤和内容：

总结：

重新开始编译

关键步骤和内容：

总结：

游戏启动时初始化指针

继续清理工作

审查/检查错误

问题：队列永远不会重置

临时修复：所有工作完成后重置队列

将队列改为循环缓冲区

Blackboard: 循环 FIFO

实现 FIFO 队列

测试 FIFO 队列

调试 FIFO 环绕问题

多线程渲染正常工作！

由于工作负载无法按顺序完成，如果有一个工作负载运行非常长时间，而其他线程在队列中循环，这时一个新的工作负载是否会覆盖仍在运行的工作负载所在的槽？

既然我们已经实现了多线程，能否在调试模式下编译，并且游戏仍然能以合理的帧率运行？

我们现在能看出它多线程后快了多少吗？

如果在添加条目时断言队列不会溢出，是否更好在没有空间写入时等待某个条目被读取？

你会称这个为线程池吗？

在调试多线程代码时，所有其他线程也会停止吗？

能否将线程数作为游戏中的配置选项？

渲染器何时能完成？

你更改了 if 条件后，WeShouldSleep 还是正确的吗？

为什么你使用 #if 0 而不是 // 或 /*？

能展示 4K 吗？

问：多线程代码比单线程代码更不可靠吗？

所以循环缓冲区是否在线程处理完一个瓦片后回收线程？我不太明白为什么选择循环缓冲区。

所以循环缓冲区是否在线程处理完一个瓦片后回收线程？我不太明白为什么选择循环缓冲区。

Blackboard: 循环缓冲区

我刚看到你在没有工作时让线程休眠，你还在使用信号量来阻塞和唤醒线程吗？还是在让线程休眠？

实现队列作为链表是否更容易？这样就没有最大大小限制了。由于我们不需要遍历列表，它应该依然很快。

在滚动缓冲区中，你会检查每个条目是否已填满，然后再写入新条目，否则跳到下一个槽位吗？

网站公告

今日签到

热门文章

最新发布