Выше определенного числа блоков CUDA Nmax время счета
увеличивается пропорционально N/Nmax, где N - число блоков.
Это число (проверено простыми тестами) равно числу блоков GPU,
которое можно определить по числу блоков в мультипроцессоре – см.
«NVIDIA CUDA C Programming Guide. Version 3.2. 2010 г. Appendix G»
Maximum number of resident blocks per multiprocessor - 8.
Nмулпроц Nблок Nнитей
Tesla C1060 30 240 240*512
Tesla C2050 (Fermi) 14 112 112*1024
Число мультипроцессоров выводится функцией свойств cudaGetDeviceProperties.
Алексеев Александр.
Отредактировано alex_rad (2011-01-29 17:59:42)