執行緒塊是CUDA中的一種抽象編程,它表示一組可以串行或並行執行的執行緒。執行緒塊中的執行緒數量曾經受架構限制,每個執行緒塊最多只有512個執行緒,但從2019年7月開始,執行緒塊可以最多包含1024個執行緒[1][2]。同一執行緒塊中的執行緒運行在同一個流處理器上。同一線塊中的執行緒可以通過共享內存、同步屏障相互通信。
多個執行緒塊組合成一個網格(grid)。同一網格中的所有執行緒塊的執行緒數量相同。