CUDAIntro
9/21 スレッドとスレッドブロック(3/3)
【テロップ】
※各テロップ文字をクリックすると該当の場所がピンポイントで閲覧できます。
【ノート】
以上に述べましたように、計算を同時に行う配列のサイズのスレッドを生成し、各スレッドは一つの配列要素の計算を担当します。 例えば、扱う配列のサイズが1024であれば、1024個のスレッドを生成して、それらのスレッドを同時に実行させて高速化を達成します。 GPUのスレッドは、32の倍数のスレッド、すなわち、32個や256個をひとまとまりとしたスレッドブロックを考えます。さらに、このスレッドブロックを複数用いて、スレッド全体を構成します。 スレッドブロック内のスレッド数には上限があります。ただし、使うGPUによって、上限が異なります。今回の学習では512を上限とします。 なお、スレッドブロック内には共有している計算資源、例えばシェアードメモリなどがありますので、スレッドブロックという単位があります。ただし、今回の学習では共有の計算資源についてはふれませんので、こういう二段階でスレッドが構成されていることだけに注意してください。