у нас есть пример нашего собственного мозга, который способен учиться на гораздо меньшем материале
Говоря об обучении людей, следует различать овладение знанием и овладение навыком. Понимание естественного языка, рисование, символьное вычисление интегралов в элементарных функциях - это навыки. Эти навыки человек осваивает уж точно на меньших обучающих выборках, чем LLM. Обучающую выборку, которую скормили GPT-4, человек и за всю жизнь не прочитает. С другой стороны, по объему
знаний LLM превосходит человека на порядки.
и, если я правильно понимаю, с гораздо меньшими затратами энергии
Энергии нынешние LLM хапают порядочно.
Отсюда:
Цитата:
The training runs for current generation models that are comparable to GPT-4o13 consumed around 20-25 megawatts of power each, lasting around three months.
Но если пересчитывать на объем знаний, то еще вопрос, кто энергоэффективнее. Сколько обедов нужно съесть человеку, чтобы выучить практически наизусть "Войну и мир"?
Можно ли сделать ИИ энергоэффективнее? Да, конечно. Для этого нужны более энергоэффективные компьютеры. И над этим работают.
К слову, в человеческом мозге порядка
100 трлн синапсов. У GPT-4, если не ошибаюсь, на два порядка меньше. Так что в каком-то смысле мозг больше как нейросеть. С другой стороны, мозг делится на специализированные зоны. Языковую модель нужно сравнивать с речевыми и ассоциативными зонами коры, а не с мозгом в целом.
Сэм Альтман вроде бы недавно жаловался, что его нейросеть больше не на чем учить - ей уже скормили весь доступный интернет. Так что мы уже уперлись в барьер, только немного другого рода. И этот барьер, имхо, будет похуже нехватки мощностей.
Пусть Сэм Альтман немного подождет. С 1950-х годов количество публикаций по физическим, техническим, биологическим и медицинским наукам удваивается каждые 14 лет.
(Подробности)
В статье (Bornmann, 2021) проведен анализ темпов роста числа научных публикаций по физическим, техническим, биологическим и медицинским наукам с использованием крупнейших баз данных. Авторы пришли к выводу, что вместо единой экспоненты или логистической кривой данные лучше всего характеризуются четырьмя экспонентами, характеризующими четыре фазы роста науки.
Фаза 1: 1675–1809 гг., с возникновения современной физики до окончания наполеоновских войн, доиндустриальный период. Характеризуется ежегодным ростом в 2,87% и временем удвоения 24,5 года.
Фаза 2: промышленная революция (1815–1882 гг.). На этом этапе наука росла очень быстро: ежегодные темпы роста составляли 5,62%, а период удвоения составлял 12,6 лет.
Фаза 3: 1881–1952 гг. Революции, войны, экономические кризисы. Характеризуется годовыми темпами роста 3,78% и временем удвоения 18,7 лет.
Фаза 4: Послевоенный период (с 1952 года по сегодняшний день). Характеризуется годовыми темпами роста 5,08% и временем удвоения 14,0 лет.
Bornmann, L., Haunschild, R. & Mutz, R. Growth rates of modern science: a latent piecewise growth curve approach to model publication numbers from established and new literature databases. Humanit Soc Sci Commun 8, 224 (2021).
https://doi.org/10.1057/s41599-021-00903-wДанных по доступному в интернете программному коду у меня нет, но подозреваю, что рост тоже экспоненциальный. Если же ему сгодится контент соцсетей, то все совсем хорошо.