Это GPT-3 такое творит?
Да, слегка модифицированная.
У меня создается впечатление что в последние лет 10...15 в обучении нейронных сетей произошел практически качественный прорыв
Это правда.
Скажем, невероятное увеличение разрешения изображения (прямо как в старых американских фильмах, где лицо преступника, снятое камерой видеонаблюдения с разрешением 30×30, удается "улучшить" до вполне приемлемого качества).
А вот это не совсем правда. Нейросеть может нарисовать реалистичную картинку, которая в низком разрешении будет выглядеть как данная, но восстановить исходное изображение не может - она по сути "придумывает" что-то похожее (и для лиц эту задачу даже называют face hallucination).
Обратите внимание, что модель, например, убрала сережку, немного поменяла изгиб губ и цвет помады на верхней фотографии, и кардинально поменяла прическу на нижней.
С другой стороны, нейронная сеть, это (в самом простом варианте) просто математическая функция с множеством входов и множеством выходов
Вся вселенная - это математическая функция:)
ее заготовка представляет по сути матрицу, на которой можно реализовать всевозможные алгоритмы
Не совсем так. Современные архитектуры, основанные на attention (а почти все нынешние впечатляющие штуки его используют) как раз заточены под определенный класс алгоритмов - грубо говоря, нам на каждом шаге нужно посмотреть на какой-то небольшой кусок входных данных, но в разные моменты на разные куски. Полносвязные сети, в которых одинаково представляются вообще любые зависимости, работают существенно хуже.
Скажем, я вот еще ни разу не слышал интересной музыки, написанной компьютером. В чем там проблема?
В определении "интересной музыки".
Вообще все примеры генерации всё еще можно отличить даже на глаз, если знать, куда смотреть
https://www.media.mit.edu/projects/dete ... /overview/. И скорее всего так будет еще довольно долго.