fixfix
2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. На страницу 1, 2  След.
 
 Задачи в machine learning
Сообщение02.04.2016, 13:56 


02/04/16
41
Областной центр
Я окончил вуз по специальности, не связанной с программированием или математикой, сейчас работаю в одной организации, которая тоже не связана с machine learning.
На слуху у многих сейчас довольно модное направление в искусственном интеллекте - машинное обучение.
У меня есть интерес получить ученую степень и сделать публикации по machine learning.
В связи с этим у меня возник вопрос:
- какие задачи стоят в machine learning (скажем, чтобы хватило на статью в журнале, желательно ВАК-ском)
- мне нужна мотивация для изучения курса machine learning, которое может занять много времени (я скачал список дисциплин курса Data Science НИУ ВШЭ).
Я нашел список ВАК-ских журналов по этой тематике: www.machinelearning.ru/wiki/index.php?title=Журналы_ВАК_по_тематике_ресурса

 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение02.04.2016, 16:57 
Заслуженный участник


09/05/12
25179
Quentin1 в сообщении #1111425 писал(а):
У меня есть интерес получить ученую степень и сделать публикации по machine learning.
В связи с чем возник этот интерес? Судя по предыдущему, с тем же успехом у Вас мог возникнуть интерес исполнить партию Одетты/Одилии в Большом театре...
Quentin1 в сообщении #1111425 писал(а):
- мне нужна мотивация для изучения курса machine learning, которое может занять много времени
Т.е. предыдущий интерес достаточной мотивацией для изучения предмета не является?

Знаете, это все даже для троллинга слишком глупо выглядит.

 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение08.04.2016, 18:53 


02/04/16
41
Областной центр
Вот нашел, на одном форуме мне посоветовали:

Цитата:
https://www.kaggle.com/ там много турниров, соревнований и практических задач по Data Science и Machine Learning (все на английском).

Вот на русском языке интересный Machine Learning Boot Camp от Mail.ru и Университета Лобачевского: http://mlbootcamp.ru/main/

Вот классный репозиторий данных для задач машинного обучения: http://archive.ics.uci.edu/ml/

 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение11.04.2016, 10:06 


03/06/15
7
Вот хороший свежий учебник, написанный для MIT Press известными в машинном обучении специалистами: http://www.deeplearningbook.org/ (Это на случай, если вам, как и мне удобнее читать, а не смотреть видео-курсы). Там даются сначала необходимые знания из математики (так что отсутствие профильного образование вам, скорей всего не будет фатально мешать, хотя и будет ощущаться), а потом рассказывается о самых важных современных моделях. Книга имеет хороший баланс между понятностью и строгостью. Авторы, повторюсь, известные люди - не каждый прохожий опубликуется в Nature: http://www.nature.com/nature/journal/v5 ... 14539.html (кстати, чтобы читать статьи из таких именитых, но платных журналов, лучше всего юзать https://sci-hub.io/ ).

Про мотивацию к конкретным курсам. Пожалуй, самым часто упоминаемым ученым в машинном обучении является Джеффри Хинтон. Сложно найти человека в среди любителей машинного обучения, который о нем не слышал бы. У него есть его видео курс на курсере от университета Торонто: https://ru.coursera.org/instructor/~154

Еще на курсере есть видео курс от Andew Ng : https://ru.coursera.org/learn/machine-learning. Эндрю Ын - основатель курсеры и ведущий специалист в Байду. Байду это Китайскй аналог Гугла и имеет, говорят, приличные успехи в машинном обучении: https://geektimes.ru/post/273582/.

И, в довершение, вот еще один классный ресурс - (http://www.arxiv-sanity.com/search?q=qa). Это поисковик по всем текущим препринтам научных статей, выходящих в области машинного обучения. Статей реально много - можно даже найти и статьи от команд Майкрософта (это текущий победитель бенчмарка ImageNet) и Гугла (который недавно сделал нейросетку, победившую чемпиона мира по Го).

К сожалению, знание английского строго обязательно, и отвертеться никак. Вся движуха в этой области - на нем.

Про задачи - вопрос, конечно, интересный. Имхо, есть два пути выбрать себе задачу. Первый путь - можно почитать статьи (на вышеупомнятом архиве) и посмотреть, чего там исследователи добиваются и как меряют свой успех. Есть разные бенчмарки ( в том числе соревновательные). Например, есть корпусы коротких текстов и вопросов по ним. И люди тренируют сетки, чтоб те отвечали на вопросы по текстам. Или - самый известный бенчмарк по распознаванию образов - Imagenet (он же открытая база изображений для обучения). Некоторые любители обучения с подкреплением заставляют сетки играть в простые игры, например, атари. Можно посмотреть на все это дело, и выбрать цель, которая больше приглянется - и попытаться улучшить имеющиеся по этому бенчмарку результаты. Другой вариант - можно взять какую-нибудь глобальную не решенную проблему, и рискнуть что-то изобрести для нее. Например, как нибудь реализовать в нейросети вот этот эффект: https://en.wikipedia.org/wiki/Fast_mapping . Риск, что ничего не получится, правда, будет выше во втором варианте, чем в первом.

Удачи. Машинное обучение это очень интерсно, и я думаю, вы сделали хороший выбор :-)

Р.S.: про отсутствие скиллов по программированию - есть одна хорошая новость. Пожалуй, самым распространенным языком программирования, на котором сейчас работают с машинным обучением, является питон. Он создан таким, чтобы пользователь мог просто сосредоточиться на описании алгоритма, не отвлекаясь на инженерные сложности вроде ручного управления памятью и всякой там типизации. То есть порог вхождения в него не высокий.

 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение11.04.2016, 18:06 


02/04/16
41
Областной центр
Спасибо большое.

 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение11.04.2016, 20:11 


02/04/16
41
Областной центр
Мне на LinkedIn упала следующая вакансия:

(Оффтоп)


 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение16.04.2016, 02:08 
Аватара пользователя


07/02/12
1446
Питер
Quentin1,
не очень понял, не являясь приматом даже на уровне высшего образования (магистра), и не занимаясь в соответсвующей области профессионально, но получив вакансию с требованием КТН, вы интересуетесь, как по-проще получить степень?

 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение16.04.2016, 15:47 


02/04/16
41
Областной центр
Я считаю, что для получения ученой степени необходимо решить научную задачу (и опубликовать решение в научном журнале). Для этого предварительно нужно стать профессионалом, по моим прикидкам для этого нужно потратить на самообучение 2 года. Вот я хочу и решить, стоит ли мне заниматься machine learning, каковы мои шансы в этой области, чтобы не тратить два года зря.

 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение16.04.2016, 15:51 
Заслуженный участник


09/05/12
25179
Quentin1 в сообщении #1115663 писал(а):
Для этого предварительно нужно стать профессионалом, по моим прикидкам для этого нужно потратить на самообучение 2 года.
А Вы, батенька, оптимист.

Сейчас обычно считается, что для перехода от общего образования к PhD нужно $4+2+4=10$ лет. И не самообразования.

 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение16.04.2016, 16:21 


02/04/16
41
Областной центр
Ну, тем более. Я хочу выяснить для себя, стоит ли ввязываться в обучение machine learning или нет. Какие задачи сейчас стоят перед исследователями в machine learning? Смогу ли я решить их? И т.д.
У меня сейчас за плечами красный диплом по специальности Электроника, так что часть математических дисциплин мне нужно только освежить в памяти: линейная алгебра, теория вероятности, мат. анализ. Знаю, что такое Back Propagation Algorithm в нейросетях.

 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение16.04.2016, 16:42 
Заслуженный участник


05/08/14
1564
Quentin1 в сообщении #1111425 писал(а):
На слуху у многих сейчас довольно модное направление в искусственном интеллекте - машинное обучение.
У меня есть интерес получить ученую степень и сделать публикации по machine learning.

В науке постоянно возникают направления, в которые устремляются много народа, следуя моде. Примерами могут служить кибернетика, синергетика, теория катастроф, диссипативные структуры, искусственный интеллект и т.п. и т.д. Обычно они имеют эмоционально окрашенные названия. По прошествии лет интерес к ним обычно остывает.
Машинное обучение - это тоже модная ветвь математической статистики, имеющая отношение к компьютерно-интенсивным вычислениям. Кроме того, в современном научном мире идет жесткая борьба за финансирование проектов, т.е. получение грантов. Больше шансов имеет та тема, то направление, которое больше впечатлит чиновников, распределяющих гранты, поэтому важно выбрать броское название для темы и убедить чиновников в её важности.
Направление "Машинное обучение" - это яркий пример такой ситуации; например, в США грант за "Машинное обучение" в среднем в 10 раз больше, чем грант за Математическую статистику, поэтому понятно, что специалист по мат.статистике будет стараться любой ценой притянуть за уши "Машинное обучение" в свой проект.
Самое надежное в вашей ситуации - это приобрести фундаментальные знания, скажем в мат.статистике, которые: 1. будут ценны независимо от моды; 2. позволят ориентироваться в любой ситуации в будущем и пригодятся при возникновении новой моды.

 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение16.04.2016, 18:12 


17/10/08

1313
Немного поправлю. В типовой задаче Data Mining нужно найти ФУНКЦИЮ или алгоритм, которая/-ый хорошо ПРОГНОЗИРУЕТ. Т.е. можно сказать, что математическая модель известна в функциональной постановке. В статистике же решаются несколько иные задачи. Поэтому математика может использоваться "любая", хотя да, тер. вер. и статистику нужно знать обязательно.

Мне видны следующие направления деятельности по Data Mining
* Создание / поддержка репозиториев
* Изобретение значимых признаков. Например, IBM предлагает различные характеристики текста: отношение (положительное / отрицательное), эмоциональность, и т.п.
* Изобретение значимых характеристик. Наиболее известны сумма, минимум, максимум, "вероятность", корреляция, фрактальные характеристики и т.д. Не так давно на Kaggle исследовалась характеристика "кажуалити" (значение от нуля до 1), т.е. какая переменная от какой зависит. Другими словами имеет ли место функциональная зависимость y=f(x) или же x = g(y). Если первое, то 1, если второе, то 0, если ни то и не сё - непонятно, то 0.5. Например, если данные кучкуются около $y=x^2$, то скорее имеем первый случай, чем второй.
* Математика извлечения значимых признаков. Исходные данные могут быть текст, аудио, видео и т.п. - из них нужно достать признаки.
* Разработка общих пакеты (обычно такие пакеты разрабатываются на репозиториях данных в надежде на то, что реальные данные потом будут в некотором роде похожи на данные обучающих репозиториев)
* Прикладная деятельность, т.е. использование наработок Data Mining на практике
И т.д. По машинному обучению список еще больше. Никаких рамок относительно математики не существует - поэтому учиться потребуется всю жизнь.

 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение16.04.2016, 18:38 
Заслуженный участник


05/08/14
1564
mserg в сообщении #1115713 писал(а):
В типовой задаче Data Mining нужно найти ФУНКЦИЮ или алгоритм, которая/-ый хорошо ПРОГНОЗИРУЕТ.

Поскольку прогнозировать абсолютно точно не получается, то чтобы учитывать неопределенности прогноза приходиться обращаться к мат. аппарату, учитывающему эти неопределенности, т.е. теории вероятностей и мат.статистике. Регрессионный анализ, как часть мат.статистики, как раз имеет отношение к поиску ФУНКЦИЙ и алгоритмов для "хороших прогнозов". В Data Mining эти регрессионные модели являются довольно "навороченными" и поэтому требуют больших затрат компьютерного времени и, как следствие, изощренных вычислительных алгоритмов.
mserg в сообщении #1115713 писал(а):
Поэтому математика может использоваться "любая", хотя да, тер. вер. и статистику нужно знать обязательно.

А чтобы знать тер. вер. и статистику надо знать анализ, лин. алгебру, методы оптимизации, численные методы.
mserg в сообщении #1115713 писал(а):
Никаких рамок относительно математики не существует - поэтому учиться потребуется всю жизнь.

Да, это правда. Мне встречались работы в этой области, использующие такую экзотику как функциональный анализ, теорию меры, дифференциальную геометрию, дифференциальную и алгебраическую топологию.

 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение19.05.2016, 16:52 


02/04/16
41
Областной центр
dsge в сообщении #1115689 писал(а):
В науке постоянно возникают направления, в которые устремляются много народа, следуя моде. ...Машинное обучение - это тоже модная ветвь математической статистики, имеющая отношение к компьютерно-интенсивным вычислениям. Кроме того, в современном научном мире идет жесткая борьба за финансирование проектов, т.е. получение грантов. Больше шансов имеет та тема, то направление, которое больше впечатлит чиновников, распределяющих гранты, поэтому важно выбрать броское название для темы и убедить чиновников в её важности.
Направление "Машинное обучение" - это яркий пример такой ситуации...

На одном форуме я спросил: "Не является ли хайпом machine learning?"
Мне ответили:
Цитата:
На машинное обучение сейчас опираются практически все когнитивные функции искусственного интеллекта: computer vision, natural language processing, robotics, а также большинство предикативных моделей.

 !  GAA:
Предупреждение за избыточное цитирование. Некоторые цитаты удалены. Часть сокращена.

 Профиль  
                  
 
 Re: Задачи в macine learning
Сообщение20.07.2016, 09:38 


02/04/16
41
Областной центр
В LinkedIn появилась следующая вакансия:
Цитата:
Research Engineer, R&D Engineer, Software Engineer, SW Developer, Programmer, Design Engineer, Research Scientist (SOUTH KOREA)
Samsung Electronics
Russian Federation

Описание вакансии

Samsung Electronics Co., Ltd. has a number of vacancies for R&D engineers, software engineers, design engineers, and researchers at its corporate RnD centers in the Republic of Korea (SOUTH KOREA).

Of particular interest are specialists majoring in one of the following areas:

RnD AREAS

*Platform- and System-Level Security Solutions

Mobile Platform Security, Information Security, C/C++, etc.

*Artificial Intelligence, Machine-Learning, Deep Learning, and Data-Mining Systems

Smart TV, Computer Vision, Image Recognition, Artificial Intelligence, Machine Learning, Deep Learning, C/C++, Java, etc.

*Mobile-Related / Smartphone-Related Software Development

Mobile Application Software, Virtualization, Object Recognition, Linux, Java, C/C++, etc.

*Network and Telecommunication System Development

LTE / GSM / UMTS / WCDMA / Software, IPTV, Cloud Computing, Linux, etc.

BASIC REQUIREMENTS

ACADEMIC BACKGROUND REQUIREMENTS

Doctor of Philosophy (Ph.D.) / Master of Sceince (MS) / Bachelor of Science (BS) degree in computer science, electronics engineering, mathematics, or optics engineering (or other relevant major)

PROFESSIONAL EXPERIENCE REQUIREMENTS

For MS / BS degree holders, more than 5 years of relevant experience in one of the above-mentioned areas

WORKSITE LOCATION

Republic of Korea (South Korea)

(relocation assistance available)

FURTHER INFORMATION

http://job.samsung.ru/vacancies.aspx

EMAIL TO SUBMIT CV IN ENGLISH

jobfair@samsung.com

Насколько реальной может быть такая вакансия?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней.  [ Сообщений: 29 ]  На страницу 1, 2  След.

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group