05/14
第一堂
|
(01) CUDA簡介
(02) 新GPU架構 - Kepler介紹
(03) Benchmark框架介紹
(04) 最佳化因素探討
(05) 樣式一:執行緒合併法
(06) 樣式二:平行擴度轉換 |
範例:Parboil環境建置
範例:Parboil操作
範例:Stencil應用(暫存器共用法)
範例:Stencil應用(二維記憶體共用法)
範例:DCS應用(分散v.s.集中)
|
05/15
第二堂
|
(07) 樣式三:資料佈局排序
(08) 樣式四:資料包箱法
(09) 樣式五:資料壓縮法
|
範例:LBM應用(分散v.s.集中)
範例:LBM應用(結構陣列 v.s. 陣列結構)
範例:Columbic Potential應用(資料包箱法)
|
05/16
第三堂
|
(10) 樣式六:執行緒私有化
(11) 矩陣乘法
(12) Multi-GPU Programming
|
範例:計數統計(執行緒私有化)
範例:矩陣乘法應用
(共享記憶體區塊化及暫存器切割)
範例:矩陣乘法應用(參數討論) |