くー!だー!
昼に食べたお蕎麦美味しかった。
CUDAの話。
今日色々と話を聞いたので備忘録的な?
CUDAにもちゃんとGPU側で実行されているもの含めて停止させたりして確認できるデバッガがある。
Parallel Nsightというらしいのだが、windowsで使う場合はGPU2つ積むか、リモートデバッグしかないらしい。
普段からリモートで作業してるしこれ使うかな。
レジスタ漏れの確認とか計算時間の測定とかはvisual profilerからできる。
こっちはだいぶ扱いやすそうだ。
新しいGPUではGPU上のスレッドから更に複数のスレッドを呼んで並列化できるらしい。
ダイナミックパラレリズムと呼ぶとか。
ダイナミックパラレリズム。
ダイナミック・パラレリズム!
必殺技っぽくていい響きだ。動的並列化(ダイナミック・パラレリズム)。正直後半が書きたかっただけの記事だった気がする。