2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1 ... 8, 9, 10, 11, 12
 
 Re: Новости ИИ
Сообщение27.01.2025, 21:59 


04/06/24
215
Маск не верит, что DeepSeek реализован на дешевых доступных чипах:

"My understanding is that Deepseek has about 50,000 H100s, which they can't talk about obviously because it is against the export controls that the U.S. has put in place. I think it is true that they have more chips that people than other people expect. But on a go forward basis, they are going to be limited by the chip controls and the export controls that we have in place."

https://seekingalpha.com/news/4398908-m ... idia-chips

Чипы H100 запрещены к экспорту в Китай, не говоря уже о России.
С другой стороны Маск, очевидно, не может считаться лицом незаинтересованным.

 Профиль  
                  
 
 Re: Новости ИИ
Сообщение27.01.2025, 22:18 
Заслуженный участник
Аватара пользователя


16/07/14
9333
Цюрих
skobar, аккуратнее цитируйте. Это сказал не Маск, а Ванг. Впрочем, откуда он мог взять эти числа, кроме как напрямую из астрала, я тоже не очень понимаю. Huggingface в процессе воспроизведения r1. Посмотрим на результаты.
Я ставлю на то, что при указанных ресурсах, качество у них получится неплохое, но заметно хуже заявленного.

 Профиль  
                  
 
 Re: Новости ИИ
Сообщение27.01.2025, 23:00 


04/06/24
215
mihaild в сообщении #1671716 писал(а):
skobar, аккуратнее цитируйте. Это сказал не Маск, а Ванг.

Да, это сказал Ванг, но Маск с ним полностью согласился (ответив "obviously"), так что по свойству транзитивности можно считать, что и Маск это сказал :)
Лично мое мнение, что слова Ванга звучат правдоподобно. Он сам китаец, и более информированный.
С точки зрения реакции рынков, tech bubble на рынке надулся изрядный, и рынок просто использует это новость как повод для здоровой назревшей коррекции и вытряхивания "weak hands". В истории рынков такое происходило регулярно.

 Профиль  
                  
 
 Re: Новости ИИ
Сообщение27.01.2025, 23:02 


20/09/09
2092
Уфа
С телеграм-канала Spydell_finance:
Цитата:
Что можно ожидать от LLMs в 2025 году?

Это как захватывающий блокбастер с непредсказуемым развитием сюжета – интересно и интригующе, но и важно, т.к. от траектории развития ИИ зависит экономический, технологический и даже геополитический мировой ландшафт.

Темп инноваций феноменальный, а вчерашние лидеры очень быстро могут стать аутсайдерами, все меняется очень быстро.

Если компании в секторе ИИ не вносят существенные инновации в среднем раз в 1.5 месяца и значительные модернизации раз в полгода – вероятность вылететь за борт резко возрастает.

Пример компании Anthropic, которая всего полгода назад была в лидерах, а теперь стремительно отказывается (нет рассуждающих модификаций моделей, нет доступа к сети, нет тонкой настройки через условный GPT, как у OpenAI или Gem, как у Google).

Даже OpenAI с «архаичной» моделью ChatGPT 4o безнадежно устарел – по сути, базовая модель не меняется два года и, если бы не релиз o1 осенью и o1 pro зимой с планами внедрения o3 в начале 2025, баланс сил был бы совершенно иным.

На Олимп врывается новой король – DeepSeek R1, но нет гарантий, что удержат темп. В чем секрет успеха DeepSeek R1, как им удалось достигнуть такой эффективности и производительности при столь малых инвестициях? Вероятно, за счет чистого обучения с подкреплением (RL) без предварительного этапа контролируемой тонкой настройки (SFT) плюс самоэволюция через алгоритмы группового сравнения выходных результатов.

Успех DeepSeek заставил более активно действовать OpenAI, ускоряя разработку и внедрение o3, которая могла выйти не ранее середины 2025, эксплуатируя ресурс o1.

По сути, DeepSeek заставляет задуматься, а на какой черт нужны инвестиции в сотни миллиардов долларов в ИИ, когда можно управиться небольшой командой с ресурсами на три (!) порядка меньше, т.е. в тысячи раз?

Феномен DeepSeek еще предстоит изучить, а пока технологический сектор США в ошарашенном состоянии пытается спешно ускорять внедрение прогрессивных моделей.

В следующие три месяца должны быть представлены: OpenAI ChatGPT o3, Google Gemini 2 в расширенной версии с механизмом рассуждения, Grok3, Claude 4 с вероятным доступом в сеть и рассуждением, а особенно интересно, как и в каком направлении будет развиваться DeepSeek?

С каждым месяцем стоимость прогресса возрастает, а видимость прогресса снижается, сейчас уже сложно добиться количественного прогресса, т.к. наборы качественных данных ограничены.

LLM начинаются тренироваться на синтетических данных, сгенерированных самими LLM, но что если изначальное качество генерации остается низким, искажая весь процесс обучения?

Что я ожидаю в 2025?

● Усовершенствованные рассуждения и логические способности (впервые появились в начале осени 2024): LLM станет лучше для решения сложных задач, которые требуют нескольких шагов, планирование и структурированные логические выводы. Это включает в себя понимание причинно-следственных и эффектных рассуждений.

● Контроль над ошибками и верификация результатов – это основное препятствие к внедрению LLMs в бизнес проекты, но процесс активной стабилизации галлюцинации ГИИ начался в 2024 и очевидно будет продолжен в 2025.

● Более глубокая персонализация и настройка через прямые пользовательские инструкции для LLMs (то, что было внедрено еще в конце 2023, но должно получить развитие и улучшение гибкости в 2025 и далее).

● Внедрение пользовательских агентов: обычные скрипты, которые благодаря расширенному функционалу и возможностям ГИИ способны лучше и эффективнее автоматизировать рутинные задачи по широкому спектру. Первый блин комом от OpenAI с ИИ агентом Operator на прошлой неделе, но это только начало.

● Возможность появления глубокого анализа контента так, как это частично пытается внедрить Genspark, что позволит создавать детализированные ответы и исследования на пользовательские запросы через анализ сотен различных источников.

● Развитие поисковых систем на основе ГИИ.

На развитие LLMs смотрю позитивно, понимания при этом, что не стоит ждать чудес сразу – слишком мало времени прошло от массового внедрения.

 Профиль  
                  
 
 Re: Новости ИИ
Сообщение28.01.2025, 10:28 


20/09/09
2092
Уфа
mihaild в сообщении #1671708 писал(а):
Rasool в сообщении #1671688 писал(а):
Означает ли это, что эра ИИ наступила не только для крупных центров вроде США, Москвы, но и для таких провинциальных городов, как Уфа с их скромными ресурсами?
Что такое "эра ИИ для Уфы"? При современной связи где хостится модель - неважно для большинства приложений. Мой телеграмм-бот, внутри зовущий Gemini, успешно хостится на виртуалке за 5 долларов в месяц. Для каких уникальных задач Уфе нужно учить свою модель? Или для каких её задач стоимость 10 долларов за токен это дорого, а 1 нормально?

Я имел в виду возможность трудоустройства в области ИИ в Уфе.

 Профиль  
                  
 
 Re: Новости ИИ
Сообщение28.01.2025, 15:56 
Аватара пользователя


29/05/17
815
Rasool в сообщении #1671750 писал(а):
Я имел в виду возможность трудоустройства в области ИИ в Уфе.

Можно устроиться на работу в удалённом формате в городе-герое Москве.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 171 ]  На страницу Пред.  1 ... 8, 9, 10, 11, 12

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group