天炉48町に書き溜めていたCUDA関連の記事を毎日コツコツ復活させていきます。ありがとう、wayback machine。新ブログは https://enp1s0.github.io/blog/ 。
SUN | MON | TUE | WED | THU | FRI | SAT |
---|---|---|---|---|---|---|
1 tsuki | 2 tsuki | 3 tsuki | 4 tsuki | 5 tsuki | 6 tsuki | 7 tsuki |
8 tsuki | 9 tsuki | 10 tsuki | 11 tsuki | 12 tsuki | 13 tsuki | 14 tsuki |
15 tsuki | 16 tsuki | 17 tsuki | 18 tsuki | 19 tsuki | 20 tsuki | 21 tsuki |
22 tsuki | 23 tsuki | 24 tsuki | 25 tsuki |
- 12/1Occupancyを可視化するOccupancyを可視化する | 天炉48町
- 12/2PTXでf16x2PTXでf16x2 | 天炉48町
- 12/3多次元Block sizeのWarp idについて多次元Block sizeのWarp idについて | 天炉48町
- 12/4CUDAの静的ライブラリを作るにはCUDAの静的ライブラリを作るには | 天炉48町
- 12/5AmpereのTensorコアの話 | 天炉48町
- 12/6CUDAの整数 & bit演算関数CUDAの整数 & bit演算関数 | 天炉48町
- 12/7CUDA Kernel内でのポインタの指しているメモリ判定CUDA Kernel内でのポインタの指しているメモリ判定 | 天炉48町
- 12/8CUDAでShared memoryを48KiB以上使うにはCUDAでShared memoryを48KiB以上使うには | 天炉48町
- 12/9CUDA Profiler ControlCUDA Profiler Control | 天炉48町
- 12/10nvccのコンパイル時の一時ファイルを残す方法nvccのコンパイル時の一時ファイルを残す方法 | 天炉48町
- 12/11CUDAのプロジェクトのMakefileCUDAのプロジェクトのMakefile | 天炉48町
- 12/12CUDA #pragma unrollについてのtipsCUDA #pragma unrollについてのtips | 天炉48町
- 12/13cudaGetDevicePropertiesとcudaDeviceGetAttributecudaGetDevicePropertiesとcudaDeviceGetAttribute | 天炉48町
- 12/14CUDAのstreamにhost関数を流すにはCUDAのstreamにhost関数を流すには | 天炉48町
- 12/15CUDAのwarpSizeについてCUDAのwarpSizeについて | 天炉48町
- 12/16CUDA half2のmax/minCUDA half2のmax/min | 天炉48町
- 12/17CUDA device関数を別コンパイル単位に書く (ptxas fatal : Unresolved extern function)CUDA device関数を別コンパイル単位に書く (ptxas fatal : Unresolved extern function) | 天炉48町
- 12/18CUDAの__device__関数のポインタを用いてif分岐を削除することに速度的優位性はあるか?CUDAの__device__関数のポインタを用いてif分岐を削除することに速度的優位性はあるか? | 天炉48町
- 12/19CUDAでLambda関数CUDAでLambda関数 | 天炉48町
- 12/20cuRANDの各アルゴリズムのスループット比較cuRANDの各アルゴリズムのスループット比較 | 天炉48町
- 12/21CUDAの単精度浮動小数点数近似除算命令CUDAの単精度浮動小数点数近似除算命令 | 天炉48町
- 12/22Ampere世代のGPUはFP32->TF32の丸め回路を持つか?Ampere世代のGPUはFP32->TF32の丸め回路を持つか? | 天炉48町
- 12/23Fortran+OpenACCのsubroutine内可変長配列Fortran+OpenACCのsubroutine内可変長配列 | 天炉48町
- 12/24NVVP/nvprofのサポート終了と代替品NVVP/nvprofのサポート終了と代替品 | 天炉48町
- 12/25精度補正を加えたTensorコアによる単精度積について精度補正を加えたTensorコアによる単精度積について | 天炉48町