Всем доброе время суток.
Хочу задать вопрос.
Допустим есть массив:
__device__ __constant__ unsigned char constArray[64];
в функции ядра его необходимо скопировать в локальную или глобальную переменную например unsigned char cudaArray[64];
Можно это сделать обычным циклом : for(i=0;i<64;i++) cudaArray[i]=constArray[i];
Но, насколько я понимаю, копировать из константной памяти в глобальную посимвольно - это довольно таки медленно.
Как это можно сделать более быстро, если можно ?
есть ли аналог memcpy для функций ядра ?