05/15
第一堂
|
(01) CUDA簡介
(02) 新GPU架構 - Kepler介紹
(03) Benchmark框架介紹
(04) 最佳化因素
(05) 樣式一:執行緒增厚法
(06) 樣式二:平行度擴充轉換
|
範例:Parboil環境建置
範例:Parboil操作
範例:Stencil應用(二維記憶體切割)
範例:Stencil應用(暫存器切割)
範例:DCS應用(分散v.s.集中)
|
05/06
第二堂
|
((07) 樣式三:資料佈局排序
(08) 樣式四:資料包箱法
(09) 樣式五:資料壓縮法
|
範例:LBM應用(分散v.s.集中)
範例:LBM應用(結構陣列 v.s. 陣列結構)
範例:稀疏矩陣向量乘法
|
05/17
第三堂
|
(10) 案例討論:矩陣乘法
(11) 樣式六:執行緒私有化
(12) CUDA綜合議題討論
|
範例:矩陣乘法應用
(共享記憶體區塊化及暫存器切割)
範例:矩陣乘法應用(參數討論)
範例:統計圖表(執行緒私有化)
|