2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Распознавание рукописного текста в качестве бакалаврской...
Сообщение02.10.2009, 19:40 


15/07/09
8
Ближе к весне хочу написать бакалаврскую работу и поступить на магистратуру.
Над темой задумываюсь уже сейчас.
Учусь на специальности "Вычислительные машины, комплексы, системы и сети" в УГАТУ
Сейчас проходим курс Нейрокомпьютеры и курс Системы ИИ.
Стало интересно.
Я достаточно четко понимаю, что чтобы написать прогу с использованием ИИ надо почитать дополнительную литературу. Препод на этих курсах у нас один и тот же. На лекции он приносит книжки, которые можно дополнительно почитать. Еще он посещает конференции по ИИ.
Сейчас уехал на остров Крит на какую-то международную конференцию. Вообщем производит серьезное впечатление.
Когда я спросил, возможно ли за 6-7 месяцев написать такую прогу студенту в одиночку, он сказал да.
Теперь хочу узнать мнение компетентных людей на этом форуме. Вопрос: как вы оцениваете мои шансы? Желательно аргументировать.

П.С.:В качестве языка программирования планирую использовать С++, его либы и, возможно, GPGPU.
С самим языком проблем нет, GPGPU тоже "пощупал". От несложной(которую на преподавали) математики не тошнит.

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение02.10.2009, 21:01 
Аватара пользователя


28/02/09
19
Евпатория
Нужно четко представлять алгоритм реализации и конечную цель данной программы.
Если алгоритм полностью понятен и можно прикинуть реализацию, то можно браться.
На мой взгляд "с нуля" это достаточно сложно.
Хотя можно "убавить" цель, применив простые алгоритмы или существующие библиотеки. Или усовершенствование библиотеки.

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение02.10.2009, 21:38 


15/07/09
8
delphiec
1) Я думаю, что для начала надо где-то взять обучающую выборку. К сожалению мой почерк даже я сам не всегда могу понять по буквам - применяю контекстный анализ. Надо найти каких - нибудь девченок с более менее нормальным почерком, которые за отдельную плату сделают эту выборку.
2) Потом надо будет все отсканировать с хорошим разрешением в битмап формат. Сжать всегда успеем.
Далее начинается искусство ...
3) Разработка принципов работы сканера...
4) Интуитивный и машинный анализ данных, выбор признаков букв.
5) Создание алгоритма нормирования входных данных, выбор модели хранения информации о входных данных(т.е. не обязательно подавать на вход сетей пикселы, может в нужен иной подход).
6) Создание алгоритмов выделения отдельных признаков.
7) Создание алгоритмов-экспертов, каждый из которых знает свою букву.
8) Конечная алгоритма, предоставляющего результаты.

-- Пт окт 02, 2009 22:40:23 --

4) и 5) - самой сложное. Нужен креатив. От этих пунктов зависит успех или неудача.

-- Пт окт 02, 2009 22:49:38 --

Забыл - надо еще сделать алгоритм, отфильтровывающий шумы во входных данных - бумага не идеально белая, а ручки бывают цветными.

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение02.10.2009, 22:55 
Заслуженный участник


09/08/09
3438
С.Петербург
Вот здесь посмотрите, как Microsoft с помощью НС рукописный текст распознает (ничего конкретно, но может оказаться полезным):
http://blogs.msdn.com/e7ru/archive/2009/02/18/recognizing-improvements-in-windows-7-handwriting.aspx

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение02.10.2009, 23:22 
Аватара пользователя


31/10/08
1244
Лично я сейчас застрял на алгоритме сегментации.

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение02.10.2009, 23:42 
Заслуженный участник


09/08/09
3438
С.Петербург
Pavia в сообщении #248581 писал(а):
Лично я сейчас застрял на алгоритме сегментации.
А Microsoft вроде не сегментирует; прямо все слово "кусочком" и распознает. Правда, им проще - у них слов больше, но форм каждого слова существенно меньше.

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.10.2009, 06:52 


15/07/09
8
Pavia
Ал-м сегментации - процесс выделения отдельных букв в слове?

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.10.2009, 12:57 
Заслуженный участник
Аватара пользователя


01/08/06
3053
Уфа
Цитата:
Microsoft работает над технологией распознавания рукописного текста более 15 лет.
Цитата:
за 6-7 месяцев написать такую прогу студенту в одиночку, он сказал да

Где-то здесь противоречие :D

Думаю, Вам стоило бы сильно урезать потенциальные возможности Вашей будущей бакалаврской, чтобы был шанс сделать что-то работающее. Например, ограничиться случаем распознавания отдельно стоящих рукописных букв, написанных одним (хорошим) почерком и идеально очищенных от мусора. Хотя даже насчёт возможности реализации такого за 6-7 месяцев у меня есть сомнения...

Вот, к примеру, FineReader распознаёт только печатный текст и весьма чувствителен к мусору. А ведь люди за него платят.

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.10.2009, 13:06 
Заслуженный участник


15/05/05
3445
USA
B7_Ruslan в сообщении #248536 писал(а):
Теперь хочу узнать мнение компетентных людей на этом форуме. Вопрос: как вы оцениваете мои шансы? Желательно аргументировать.
Требования к работе на бакалавра значительно более скромные, чем требования к магистерской или докторской диссертации. ИМХО, даже если Вы реализуете распознавание только печатного текста, для бакалавра этого будет вполне достаточно.

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.10.2009, 14:29 
Аватара пользователя


31/10/08
1244
B7_Ruslan
По поводу рукописного текста. Существует 2 метода ввода рукописного текста.

1) Бумага и ручка, а затем оцифровка при помощи сканера\фотика.
2) Использовать манипулятор для прямого ввода текста в компьютер. Мышь или сенсорный экран и тд.

Собственно насколько я знаю 2 вариант гораздо проще для распознавания и в майкрософт занимаются именно им.

Собственно предлагаю автору остановится на нем. А потом если время останется то перейти к 1.


Цитата:
Ал-м сегментации - процесс выделения отдельных букв в слове?
Вначале хотя бы слова.

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.10.2009, 18:25 
Аватара пользователя


27/11/07
1
Boulder,USA & Moscow,Russia
B7_Ruslan, нереально. Поверьте тем, кто занимается этим профессионально. В одиночку за такой срок без опыта решения подобных задач (обработка данных, машинное обучение и работа с изображениями) - нереально. Перед Вами встанет большое количество задач самого разного характера, как технических, так и содержательных, каждая из которых может потребовать несколько месяцев серьезной работы. В итоге теоретически возможно, что путем неимоверных усилий Вы сумеете к сроку создать что-то работающее, но работать оно будет плохо и фактически только на обучающем материале. Это может быть станет и неплохим опытом лично для Вас, но со стороны будет смотреться скорее всего весьма кустарно. И в любом случае потребует от Вас такой самоотдачи все эти месяцы, что может в дальнейшем начисто отбить у Вас охоту к дальнейшему движению в этом направлении.
Еще нужно отметить, что данная задача требует реально много обучающего материала. Очень много, измеряемого минимум десятками тысяч. Девочки даже с хорошим почерком Вам его не смогут обеспечить, так как уже минут через 15 непрерывного написания почерк уже будет не таким хорошим, а минут через 40 пойдут такие каракули, которые даже человек с трудом прочтет.
Пока Вы не очень представляете себе ни специфики задачи, ни свои возможности в этой задаче, лучше ставить перед собой более скромные и реальные цели, а достигнув их - двигаться дальше.
Рекомендую для начала заняться более простыми задачами. Поищите такие, которые описаны в литературе. Для многих стандартных задач можно найти учебные базы данных, на которых можно учить системы. В статьях Вы найдете подходы, которые можно будет применить, если у Вас возникнут сложности. Это даст Вам хороший список литературы, что повысит работу в глазах критиков. Кроме того, на таких задачах Вы сможете сравнить эффективность Вашего метода с известными результатами, что всегда полезно - хоть какая-то объективная оценка. Когда Вы будете защищать работу, то Вас обязательно спросят о том, как соотносятся Ваши результаты с известными.

В качестве хорошей задачи могу предложить, например, распознавание отдельных рукописных цифр. По этой ссылке Вы найдете базу данных для обучения: 60 тысяч train и 10 тысяч test images. Также приводится таблица результатов разных авторов на этой базе: начиная от 12% ошибки в 98 году и заканчивая десятыми долями процента ошибки в этом году. Можете попробовать за 2-3 месяца поработать с этой базой вслепую, не читая описаний походов других, и посмотреть, чего получится добиться. Если ничего не будет получаться, то всегда остается возможность взять статьи, которые тут же приведены, и реализовать подходы, примененные авторами. Кроме того, Вы наверняка найдете еще базы данных, которые можно добавить к этой для лучшего обучения.

Можете поискать и другие задачи, но в любом случае настоятельно советую в качестве ориентира брать такие, к которым уже есть базы данных и какие-то подходы и известные результаты, с которыми можно сравниваться.

Успехов.

-- Сб окт 03, 2009 19:31:57 --

Если у Вас быстро получится успешно решить данную задачу, то можно будет ее усложнить, приближая к реальным условиям. Например, наложить на изображение различные шумы различного характера. А также - распознавать последовательности цифр (это будет уже ближе к задачам работы с реальным текстом), например, денежные суммы на платежных документах.

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.10.2009, 20:01 


15/07/09
8
Parascript
Спасибо за ответ.
Возьмусь за распознавание цифр.

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение04.10.2009, 01:39 
Заблокирован
Аватара пользователя


13/01/09

335
B7_Ruslan в сообщении #248783 писал(а):
Parascript
Спасибо за ответ.
Возьмусь за распознавание цифр.

Сначала возьмитесь за какую-нибудь более скромную задачу, которая полезна не только при распознавании цифр, например, распознавание пересечения линий. Кстати, задача не такая элементарная.

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение11.10.2009, 11:43 


22/09/09
275
B7_Ruslan в сообщении #248783 писал(а):
Parascript
Спасибо за ответ.
Возьмусь за распознавание цифр.

Может быть это Вам поможе
ABBYY FormReader - система ввода форм, заполненных от руки или на принтере, с применением технологии ICR (Intelligent Character Recognition).
А с текстом, написанным от руки (правда по-английски, но много - >2000 стр.) я могу помочь.

 Профиль  
                  
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.11.2009, 16:19 


10/11/06
64
В репозитории UCI есть несколько баз рукописных символов.
Например,
http://archive.ics.uci.edu/ml/datasets/Pen-Based+Recognition+of+Handwritten+Digits.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 17 ]  На страницу 1, 2  След.

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group