Уровень человека почти достигнут, я считаю, а это предел.
Непонятно на чем основано такое предположение. Нынешний уровень в лучшем случае соответствует джуну - значит теоретически чат-боты могут достигнуть уровня очень сильного или даже гениального программиста, нет?
Лично я считаю ровно наоборот. Уровень среднего человека (который обычно программировать вообще не умеет) может и достигнут, а уровень обычного разработчика не достигнут даже близко. Нормальный ИИ должен почти все алгоритмические задачки щелкать как орешки, должен мочь оптимизировать заданный код как алгоритмически (по скорости и по памяти), так и более низкоуровнево, должен мочь написать интерпретатор любого языка по спецификации и т.п.. Почти любой разраб с этим справится при наличии достаточного количества времени и денег.
И если уж нейросетки научились играть в шахматы и в го, то они просто обязаны мочь программировать вышеописанным образом.
Поясняю свою нетривиальную точку зрения.
Во-первых, программирование - это процесс итеративный: написал кусочек кода, запустил, протестировал, локализовал ошибки, исправил (это уже следующая итерация). Процесс такой: кодирование -> тестирование -> кодирование -> тестирование -> кодирование -> тестирование -> и т.д.
ChatGPT освоил исключительно одну операцию кодирования. И делает это превосходно! Но он не может запрограммировать операционную систему, ибо надо как минимум освоить тестирование (а это выходит за рамки чат-интерфейса).
То есть мы просто говорим про разное: я говорю, что ChatGPT отлично кодирует. "Уровень джуна" - это оценка общая, не про кодирование, а программирование в целом. Я бы выразился лучше так: "Уровень миддл/сеньор" - это про кодирование, "без оценки" - это про тестирование, соответственно про программирование - "неудовлетворительно, неявка".
Оптимизация по быстродействию и памяти зачастую требует анализа, а где именно происходит затык, какой массив не впихнулся в какую-то память или какой цикл не заходит в какой-то процессор. Просто так абстрактно ничего не делается. Почти.
Тестирование - это непростая задача. Ибо здесь происходит сравнение требований техзадания с промежуточным результатом, но при этом часть требований "подразумевается". Короче, тут может потребоваться обучение доменно-специфическим знаниям, а не просто словесным оперированиям NLP. Очень многие знания словесно оперируются и содержатся в корпусах текстов, но не все - это однозначно.