Ну то есть идея Дмитрия используется и даёт заметный эффект.
Всё наоборот, это идея как раз
VAL, в его программах она с самого начала, в теме её называем проверкой по индексу.
Dmitriy40, я правильно понимаю, что с Асмом было бы ещё в разы быстрее?
Пока непонятно, заменять одну ispseudoprime смысла нет (она проверяет медленнее, но в разы лучше), преимущество когда их несколько надо проверить и числа не слишком велики, вот тогда асм выходит намного быстрее.
Вообще, он есть (SPIR-V)...
Это не ассемблер: "SPIR-V is a
high-level intermediate language,". На это же намекает и буква P в обозначении, portable. Всё что не привязано к конкретной архитектуре уже однозначно не ассемблер. И да, я прекрасно понимаю все минусы ассемблера.
Ассемблером является скорее
ARB, но про него впервые слышу если честно и надо посмотреть как оно работает
и работает ли вообще на новых GPU, пока впечатление что оно устарело лет на 10, ещё когда конвейеры были специализированными (вертексный и текстурный), а не GPU, и больше не поддерживается.
CUDA работает только на NVidia.
Я в курсе. Зато она проще и более тонко можно настроить (привязаться к конкретной аппаратуре). Пока из откликнувшихся на мою
просьбу озвучить модель видюхи известно о наличии лишь одной GPU именно Nvidia.
Если и буду писать под GPU, то 90% что на OpenCL, именно ради совместимости/переносимости (к тому же его могу проверять (но не оптимизировать) на своём компе со встроенным в проц видеоядром).
Очень просто.
Спасибо, чуть позже вникну.