Files
XCEngine/docs/api/threading/task-system/parallelfor.md
ssdfasd dc850d7739 docs: 重构 API 文档结构并修正源码准确性
- 重组文档目录结构: 每个模块的概述页移动到模块子目录
- 重命名 index.md 为 main.md
- 修正所有模块文档中的错误:
  - math: FromEuler→FromEulerAngles, TransformDirection 包含缩放, Box 是 OBB, Color::ToRGBA 格式
  - containers: 新增 operator==/!= 文档, 补充 std::hash DJB 算法细节
  - core: 修复 types 链接错误
  - debug: LogLevelToString 返回大写, timestamp 是秒, Profiler 空实现标注, Windows API vs ANSI
  - memory: 修复头文件路径, malloc vs operator new, 新增方法文档
  - resources: 修复 Shader/Texture 链接错误
  - threading: TaskSystem::Wait 空实现标注, ReadWriteLock 重入描述, LambdaTask 链接
- 验证: fix_links.py 确认 0 个断裂引用
2026-03-19 00:22:30 +08:00

1.1 KiB

TaskSystem::ParallelFor

template<typename Func>
void ParallelFor(int32_t start, int32_t end, Func&& func)

并行执行 for 循环。将循环范围划分为多个块,分配给多个工作线程并行处理。

模板参数:

  • Func - 可调用对象类型,签名为 void(int32_t)

参数:

  • start - 循环起始索引(包含)
  • end - 循环结束索引(不包含)
  • func - 对每个索引执行的函数

返回:

复杂度: O(n)

分区策略:

  • 根据 std::thread::hardware_concurrency() 确定线程数。
  • 将范围均分给各线程,每个线程处理连续的块。

示例:

// 并行处理 10000 个元素
std::vector<float> data(10000, 0.0f);

TaskSystem::Get().ParallelFor(0, 10000, [&data](int32_t i) {
    data[i] = std::sin(i * 0.01f) * std::cos(i * 0.007f);
});

// 并行矩阵乘法
TaskSystem::Get().ParallelFor(0, N, [&matrix](int32_t row) {
    for (int32_t col = 0; col < N; ++col) {
        matrix[row * N + col] = Compute(row, col);
    }
});

相关文档