Писанины будет больше, а толку столько же.
К тому же на С можно и не останавливаться, а сразу и WinAPI использовать (или аналогичный интерфейс любой другой ОС).
Тут многое зависит от задачи и от разбиения её на множество подзадач (считаемых параллельно), нередко накладные расходы на связь подзадач между собой намного превышают накладные расходы на организацию многозадачности и потому как именно она организована уже без разницы.
Если надо ускорить выполнение многозадачного кода, то стоит укрупнять куски разбиения задачи, но не превышать нескольких процентов от общего (чтобы не ждать слишком долго завершения последних подзадач), но и не дробить задачу на куски длительностью микросекунды (слишком долгим будет вызов функций ОС), для себя оптимальным считаю длину подзадач в десятки миллисекунд. Уменьшать количество точек взаимодействия подзадач друг с другом. Уменьшать объёмы перезаписываемой информации в каждой подзадаче. Максимально много данных объявлять константными чтобы они не дублировались в каждую подзадачу (если компилятор это позволяет, не дублировать). По возможности использовать более простые механизмы синхронизации/арбитража подзадач друг с другом (в идеале - только критические секции с не слишком долгим кодом в них).
Перехода на более простой/примитивный язык программирования в этом списке нет - слишком мал эффект от этого (в плане организации многозадачности, не самих вычислений). Стоит задумываться когда исчерпаны все другие возможности. Тем более что высока вероятность что придётся реализовывать самому почти весь функционал механизмов арбитража более продвинутого языка, с неизбежными ошибками и временем на написание и отладку, ну кроме совсем уж простых случаев (скажем на которые хватает критических секций).
А у вас что за задача, что прирост производительности по сравнению с однопоточным вариантом сразу виден?
Таких задач полно, вопрос насколько в ней критичны именно накладные расходы организации многозадачности и синхронизации потоков между собой. Часто можно чуть по другому побить задачу на куски и все накладные расходы уходят ниже 1% общего времени. Без смены языка.
К тому уже у ТС уже многопоточный код, но он зачем-то хочет переписать его на более примитивном языке, ожидая выигрыша скорости, чего вполне может и не быть.