Так Game Over или нет?

Geen · 06.07.2023, 20:00

Webpack в сообщении #1600124 писал(а):

Цена увеличения размера нейронной сети упадёт на порядки

Ну так займитесь. Зачем на форумах лозунги впустую толкать?

Webpack · 06.07.2023, 20:48

Geen
Нет столько денег у меня. Вот OpenAI мог бы прикупить заводики полупроводниковые. Чтоб быстрей версии GPT выпускать.

Aritaborian · 06.07.2023, 23:23

mihaild в сообщении #1600063 писал(а):

Инвесторов, способных вложить сто триллионов, в мире нет.

Разумеется, нет, а я читал топик невнимательно, прошу прощения.

gevaraweb · 07.07.2023, 00:54

Я что подумал. Если этот чат-бот также хорошо будет определять, что на картинке, как и болтает, целая отрасль - компьютерное зрение - рухнет? Зачем изучать эти свертки, если подключил АПИ от чат бота, и решай любую задачу, с успехом 99,99%. А не строй свою модель, над которой надо еще колдовать, чтобы получить жалкие 90 %. А потом следом рухнут все отрасли знаний, и мы будем обучать детей в школах и вузах приятной грамотной речи, музицированию, этике и этикету, боксу...

mihaild · 07.07.2023, 01:09

gevaraweb в сообщении #1600166 писал(а):

Если этот чат-бот также хорошо будет определять, что на картинке, как и болтает, целая отрасль - компьютерное зрение - рухнет?

Он же не святым духом определять это будет, а теми же самыми методами CV. А "зачем изучать" - ну так и сейчас можно взять готовую модель, не разбираясь, как она устроена. Но кто-то её сделать должен.

gevaraweb · 07.07.2023, 01:35

mihaild в сообщении #1600168 писал(а):

Он же не святым духом определять это будет, а теми же самыми методами CV.

Этой фразы я не понял. К чему она в данном контексте? Пользователям будет без разницы, как он определяет.

(Оффтоп)

Святой Дух тоже не следует сюда приплетать

Я про то, что АПИ будет до безобразия простой. Типа -
Чат-бот, определи пж, сколько кружочков и квадратиков на картинке?
или
Чат-бот, запомни эти 100 морд. Это свои. Другие - чужие.
И он даст четкий и правильный ответ. И на кой черт изучать тогда методы CV?

mihaild · 07.07.2023, 01:38

gevaraweb в сообщении #1600171 писал(а):

Пользователям будет без разницы, как он определяет

Так пользователям и сейчас без разницы, как работает распознавание.
Модели, у которых можно спросить "что на картинке", есть прямо сейчас. Совершенно непонятно, в каком смысле их соединение с LLM угрожает CV как области.

gevaraweb · 07.07.2023, 01:43

mihaild в сообщении #1600173 писал(а):

Так пользователям и сейчас без разницы, как работает распознавание.

Ну и я про это. Не знаю зачем вы про CV загнули.

mihaild в сообщении #1600173 писал(а):

Модели, у которых можно спросить "что на картинке", есть прямо сейчас. Совершенно непонятно, в каком смысле их соединение с LLM угрожает CV как области.

Я знаю, что они есть. Но полагал, что они работают на определенном количестве картинок.
Скажем, 1000, 10000.
А если понадобятся другие 10000, модель надо резать и переобучать. Что хлопотно и не быстро. Или уже не так?
Есть модель, которая знает почти все? И ее легко подключить?

mihaild · 07.07.2023, 01:55

gevaraweb в сообщении #1600176 писал(а):

Не знаю зачем вы про CV загнули

Это Вы загнули.

gevaraweb в сообщении #1600166 писал(а):

целая отрасль - компьютерное зрение - рухнет

gevaraweb в сообщении #1600176 писал(а):

Но полагал, что они работают на определенном количестве картинок.
Скажем, 1000, 10000.

Непонятно, что это значит. Модель, которая работает только на картинках из небольшого фиксированного набора, никому не нужна.

gevaraweb в сообщении #1600176 писал(а):

Есть модель, которая знает почти все? И ее легко подключить?

Тысячи их, и демки куда можно загрузить картинку прямо из браузера элементарно гуглятся.

Webpack · 07.07.2023, 02:35

gevaraweb в сообщении #1600166 писал(а):

Я что подумал. Если этот чат-бот также хорошо будет определять, что на картинке, как и болтает, целая отрасль - компьютерное зрение - рухнет? Зачем изучать эти свертки, если подключил АПИ от чат бота, и решай любую задачу, с успехом 99,99%. А не строй свою модель, над которой надо еще колдовать, чтобы получить жалкие 90 %. А потом следом рухнут все отрасли знаний, и мы будем обучать детей в школах и вузах приятной грамотной речи, музицированию, этике и этикету, боксу...

Задачу надо уметь поставить. Как бокс этому поможет?

gevaraweb · 07.07.2023, 10:23

Webpack в сообщении #1600185 писал(а):

Задачу надо уметь поставить. Как бокс этому поможет?

Бокс - нет. Приятная грамотная речь - да. Хотя да, примитивная математика - тоже. Ну вот что ли пример:
Чат-ботушка, найти пожалуйста количество и площадь туберкулезных поражений головного мозга по снимку МРТ (белые кружочки)?

Dedekind в сообщении #1597922 писал(а):

Задача. Автоматически найти количество и площадь туберкулезных поражений головного мозга по снимку МРТ (белые кружочки).

(Изображение и гистограмма)

Изображение.

Ладно, если в CV все как хорошо, Вам, mihaild, понадобится 5-10 минут, чтобы решить эту задачку?

(Оффтоп)

mihaild в сообщении #1600180 писал(а):

Это Вы загнули.

Нее, вы первый загнули. Перечитайте сообщения. А мы разогнули.

mihaild в сообщении #1600180 писал(а):

Модель, которая работает только на картинках из небольшого фиксированного набора, никому не нужна.

Я имел в виду, например, ставшей можно сказать учебной задачу про Fashion MNIST. Или эта задача уже не актуальна, учить ее решать не нужно? Но не только такую задачу.

mihaild · 07.07.2023, 11:33

gevaraweb в сообщении #1600202 писал(а):

Ладно, если в CV все как хорошо, Вам, mihaild, понадобится 5-10 минут, чтобы решить эту задачку?

Я не говорю, что там всё хорошо. Я говорю, что LLM тут ничего сильно нового не добавляют.

gevaraweb в сообщении #1600202 писал(а):

Нее, вы первый загнули. Перечитайте сообщения

Перечитал. Первое упоминание CV вообще, и его падения в частности - Ваше.

gevaraweb в сообщении #1600202 писал(а):

Я имел в виду, например, ставшей можно сказать учебной задачу про Fashion MNIST

Предполагается, что модель, обученная на FashionMNIT, может распознавать картинки не только из 10 тысяч тестовых примеров, но и примерно неограниченное количество похожих.

gevaraweb · 07.07.2023, 11:49

mihaild в сообщении #1600168 писал(а):

А "зачем изучать" - ну так и сейчас можно взять готовую модель, не разбираясь, как она устроена.

mihaild в сообщении #1600208 писал(а):

Я не говорю, что там всё хорошо.

Ну звучит то (первая фраза) очень хорошо. Взял готовую модель, и вперед. Потом выясняется, что 10 минут Вам не хватит. Я боюсь, что непосвященному тем более и часу не хватит.
А мне хватит двух минут, чтобы сформулировать вопрос чат-боту. Я об этом говорю. Зачем мне изучать CV, если я могу поставить задачу чат-боту? И мне абсолютно будет по барабану, как он это делает.

mihaild в сообщении #1600208 писал(а):

Предполагается, что модель, обученная на FashionMNIT, может распознавать картинки не только из 10 тысяч тестовых примеров, но и примерно неограниченное количество похожих.

Ну я думал, что как бэ очевидно, что я говорю о количестве типов в классификации.

mihaild в сообщении #1600208 писал(а):

Перечитал. Первое упоминание CV вообще, и его падения в частности - Ваше.

Где? процитируйте.

mihaild · 07.07.2023, 12:08

gevaraweb в сообщении #1600212 писал(а):

Ну звучит то (первая фраза) очень хорошо. Взял готовую модель, и вперед. Потом выясняется, что 10 минут Вам не хватит

10 минут хватит на то, чтобы сделать то, что готовые модели делать умеют. Ничего нового LLM сюда не вносят.

gevaraweb в сообщении #1600212 писал(а):

А мне хватит двух минут, чтобы сформулировать вопрос чат-боту

Для Visual Question Answering LLM не нужны. Я не знаю, умеют ли они сейчас решать задачи вроде предложенной Dedekind, но если не умеют - интеграция их с LLM ничего не даст.
Чатбот может быть удобным интерфейсом. Но те, кто им будет пользоваться, всё равно модели сейчас не разрабатывают. А те, кто разрабатывают - ну будут разрабатывать немного другие, что изменится-то?

gevaraweb в сообщении #1600212 писал(а):

Ну я думал, что как бэ очевидно, что я говорю о количестве типов в классификации

Как бэ когда говорят "работают на определенном количестве картинок" мне очень сложно прочитать это как "классифицируют на определенное количество классов".
Есть модели, которые по картинке генерируют текстовое описание.

gevaraweb в сообщении #1600212 писал(а):

Где? процитируйте.

Выше уже цитировал.

gevaraweb в сообщении #1600166 писал(а):

Если этот чат-бот также хорошо будет определять, что на картинке, как и болтает, целая отрасль - компьютерное зрение - рухнет?

gevaraweb · 07.07.2023, 13:14

mihaild в сообщении #1600218 писал(а):

Выше уже цитировал.gevaraweb в сообщении #1600166
писал(а):
Если этот чат-бот также хорошо будет определять, что на картинке, как и болтает, целая отрасль - компьютерное зрение - рухнет?

Я в упор не вижу, что пишу тут о том, с помощью каких технологий будет работать сам чат-бот. Мне это без разницы.

Ладно, распишу подробнее.
Придет студент на направление ИИ, обучим его 4 года, потом скажем (если будем честными):
Ваши модели будут работать плохо, поэтому используйте чат-бот.
Или ему об этом на работе скажут.

Цитата:

Вон Люся, после школы, умеет работать в Паинте, прошла недельный курс работы с чат-ботом.
За 10 минут сделала работающее приложение, которое работает на 99.99.
А ты делал неделю, и у тебя 90 проц.

Тем временем Люся:

Цитата:

Чат-ботушка, я выделила красным квадратиком червячков на картинке, научись их считать.

Научный форум dxdy

Так Game Over или нет?