Выше определенного числа блоков CUDA Nmax время счета
увеличивается пропорционально N/Nmax, где N - число блоков.
Это число (проверено простыми тестами) равно числу блоков GPU,
которое можно определить по числу блоков в мультипроцессоре – см.
«NVIDIA CUDA C Programming Guide. Version 3.2. 2010 г. Appendix G»
Maximum number of resident blocks per multiprocessor - 8.

                               Nмулпроц   Nблок     Nнитей
Tesla C1060               30             240        240*512
Tesla C2050 (Fermi)    14             112        112*1024

Число мультипроцессоров выводится функцией свойств cudaGetDeviceProperties.

Алексеев Александр.

Отредактировано alex_rad (2011-01-29 17:59:42)