進階課程
(第一堂) |
(1) 材質記憶體
(2) 常數記憶體
(3) 記憶體總成
(4) 暫存器最佳化
(5) 合併存取最佳化
(6) 共享記憶體最佳化
(7) 常數記憶體最佳化 |
範例:材質記憶體配置及使用
範例:常數記憶體配置及使用
範例:各種記憶體使用及比較
範例:矩陣乘法應用(暫存器最佳化)
範例:矩陣乘法應用(合併存取最佳化)
範例:矩陣乘法應用(共享記憶體最佳化)
範例:矩陣乘法應用(常數記憶體最佳化) |
進階課程
(第二堂) |
(8) 內建函式介紹
(9) 材質記憶體最佳化
(10) Occupancy
(11) CUDA streams
(12) zero-copy
(13) 最佳化總成
(14) Fermi最佳化介紹
(15) 多GPU運算
(16) 加速GPU程式開發的新利器- HMPP & PGI Accelerator |
範例:數學函式、原子函式
範例:2D texture配置及使用
範例:CUDA Occupancy Calculator
範例:CUDA streams 使用
範例:zero-copy 使用
範例:MPI / openMP + CUDA 使用 |