[cuda-learning-notes] 硬件抽象和执行模型

编程模型 线程组织层次 grid 网格 由一个内核函数启动所产生的所有线程统称为一个网格(grid) grid size和block size都是三维结构,dim3类...

2024-03-01 4533 words 10 min

[cuda-learning-notes] 内存模型

内存模型 全局内存 对全局内存变量的理解: 从主机端看,全局内存变量只是一个指针,主机端不知道其指向何方。主机端也无法进行操作 从设备端看,即为全局...

2024-03-01 7450 words 15 min

[cuda-learning-notes] 流和同步

CUDA事件 事件:标记stream执行过程的某个特定的点,比如用于计时 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 cudaEvent_t start, stop; CHECK(cudaEventCreate(&start)); // 创建cuda 事件对象。 CHECK(cudaEventCreate(&stop)); CHECK(cudaEventRecord(start, 0)); //...

2024-03-01 6056 words 13 min

[cuda-learning-notes] 工具使用和profile

工具 nvidia-smi -L:显示设备名称,精简信息 -q -i 0:显示0号设备详细状态信息 -q -i 0 -d MEMORY:从详细状态信息中提取某类信息(比如MEMORY、CO...

2024-03-01 1424 words 3 min

[cuda-learning-notes] GPU架构发展、兼容性和编译

CUDA编译链和兼容性 兼容性 CPU与GPU的区别 CPU只有少量的计算核心,有更多晶体管用于数据缓存和流程控制, GPU有大量计算能力较弱的计算...

2024-03-01 11734 words 24 min