04/18
(第一堂)
|
(01) Fortran 90/95 回顧
(視現場學員程度)
(02) GPU硬體介紹
(03) 安裝 CUDA (PGI fortran)
(04) 標準執行流程
(05) 範例:記憶體宣告、複製
(06) 範例:hello world
(07) 執行緒群組
|
(08) 效能量測 cuda event
(09) 範例:看執行緒 ID
(10) 範例:向量加法
(11) 共享記憶體
(12) 執行緒同步化
(13) 範例:tree reduction
(14) 範例:向量內積
|
04/19
(第二堂)
|
(15) 多維執行緒
(16) 合併存取
(17) 範例:執行緒亂排
(18) 範例:矩陣轉秩
(19) 範例:矩陣乘法
(20) SDK 介紹
|
(21) 範例:SDK/deviceQuery
(22) 範例:SDK/bandwidthTest
(23) 範例:SDK 其它程式
(24) 函式庫介紹
(25) 範例:cublas 示範
(26) GPU概念及進階課程介紹
(27) 加速GPU程式開發的新利器
-HMPP & PGI Accelerator
|