マルチスレッド活用のボクセル処理では、GCDよりNSOperationを用いて実装した方が高速でした。これは、NSOperationクラスにsetThreadPriority:メソッドがあり、各スレッドの優先度を制御できるのがポイントのようです。また、タスク分散においては、デュアルコアならば2スレッドだけ用意すればOKのような気がしますが、CPUの仕組み上(キャッシュヒットが関係か?)2スレッドよりも4や8スレッドに処理を分散させた方が、結果的に高速になるケースが多々あります(多過ぎるのはダメ)。
将来のクアドコア投入を考慮して8スレッドに決定か?
MacではHyper-Threadingを1コアと数えても、それ以上のスレッド数(32など)を用意します。