(01)硬體介紹
(02)安裝 CUDA
(03)標準執行流程
(04)範例:記憶體宣告、複製
(05)範例:hello world
(06)執行緒群組
(07)效能量測 cuda event
(08)範例:看執行緒 ID
(09)範例:linearized index
(10)範例:向量加法 |
(11)暫存器
(12)共享記憶體
(13)執行緒同步化
(14)範例:tree reduction
(15)範例:向量內積
(16)多維執行緒
(17)合併存取
(18)範例:執行緒亂排
(19)範例:矩陣轉秩
(20)範例:矩陣乘法 |