標籤
shared memory
shared memory 是 GPU CUDA 效能調校的核心區塊,常和 warp、bank conflict、cp.async、pipeline 一起討論。它決定資料能否快速在執行緒間共享,也影響 HBM 延遲能否被有效隱藏。
2 篇文章
標籤
shared memory 是 GPU CUDA 效能調校的核心區塊,常和 warp、bank conflict、cp.async、pipeline 一起討論。它決定資料能否快速在執行緒間共享,也影響 HBM 延遲能否被有效隱藏。
2 篇文章