В общем, с нейрочипом не всё так просто. Драйвера-то есть, но совсем не документированы. Очень тяжко и долго идет работа - почти как реверс-инжиниринг.
Надо посмотреть в сторону GPU, которое GPGPU в случае с орандж (так как в моих проектах графической оболочки нет, то можно использовать "графику" под свои задачи). Тут использован ускоритель mali g610 с 64 ядрами на 1 ГГц, который поддерживает opencl (2.1 по-моему)..
Лет 10 назад сравнивал cuda vs opencl для какой-то нвидиа карты (не своим естественно кодом, а чем-то там тестовым для майнинга). Помню, что для тех версий было примерно одинаково по производительности.
OpenCL хотя бы документирована неплохо..

Главное правильно задачу распараллелить на всякие там кластеры, айтемы и проч..