2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу 1, 2  След.
 
 Распознавание рукописного текста в качестве бакалаврской...
Сообщение02.10.2009, 19:40 
Ближе к весне хочу написать бакалаврскую работу и поступить на магистратуру.
Над темой задумываюсь уже сейчас.
Учусь на специальности "Вычислительные машины, комплексы, системы и сети" в УГАТУ
Сейчас проходим курс Нейрокомпьютеры и курс Системы ИИ.
Стало интересно.
Я достаточно четко понимаю, что чтобы написать прогу с использованием ИИ надо почитать дополнительную литературу. Препод на этих курсах у нас один и тот же. На лекции он приносит книжки, которые можно дополнительно почитать. Еще он посещает конференции по ИИ.
Сейчас уехал на остров Крит на какую-то международную конференцию. Вообщем производит серьезное впечатление.
Когда я спросил, возможно ли за 6-7 месяцев написать такую прогу студенту в одиночку, он сказал да.
Теперь хочу узнать мнение компетентных людей на этом форуме. Вопрос: как вы оцениваете мои шансы? Желательно аргументировать.

П.С.:В качестве языка программирования планирую использовать С++, его либы и, возможно, GPGPU.
С самим языком проблем нет, GPGPU тоже "пощупал". От несложной(которую на преподавали) математики не тошнит.

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение02.10.2009, 21:01 
Аватара пользователя
Нужно четко представлять алгоритм реализации и конечную цель данной программы.
Если алгоритм полностью понятен и можно прикинуть реализацию, то можно браться.
На мой взгляд "с нуля" это достаточно сложно.
Хотя можно "убавить" цель, применив простые алгоритмы или существующие библиотеки. Или усовершенствование библиотеки.

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение02.10.2009, 21:38 
delphiec
1) Я думаю, что для начала надо где-то взять обучающую выборку. К сожалению мой почерк даже я сам не всегда могу понять по буквам - применяю контекстный анализ. Надо найти каких - нибудь девченок с более менее нормальным почерком, которые за отдельную плату сделают эту выборку.
2) Потом надо будет все отсканировать с хорошим разрешением в битмап формат. Сжать всегда успеем.
Далее начинается искусство ...
3) Разработка принципов работы сканера...
4) Интуитивный и машинный анализ данных, выбор признаков букв.
5) Создание алгоритма нормирования входных данных, выбор модели хранения информации о входных данных(т.е. не обязательно подавать на вход сетей пикселы, может в нужен иной подход).
6) Создание алгоритмов выделения отдельных признаков.
7) Создание алгоритмов-экспертов, каждый из которых знает свою букву.
8) Конечная алгоритма, предоставляющего результаты.

-- Пт окт 02, 2009 22:40:23 --

4) и 5) - самой сложное. Нужен креатив. От этих пунктов зависит успех или неудача.

-- Пт окт 02, 2009 22:49:38 --

Забыл - надо еще сделать алгоритм, отфильтровывающий шумы во входных данных - бумага не идеально белая, а ручки бывают цветными.

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение02.10.2009, 22:55 
Вот здесь посмотрите, как Microsoft с помощью НС рукописный текст распознает (ничего конкретно, но может оказаться полезным):
http://blogs.msdn.com/e7ru/archive/2009/02/18/recognizing-improvements-in-windows-7-handwriting.aspx

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение02.10.2009, 23:22 
Аватара пользователя
Лично я сейчас застрял на алгоритме сегментации.

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение02.10.2009, 23:42 
Pavia в сообщении #248581 писал(а):
Лично я сейчас застрял на алгоритме сегментации.
А Microsoft вроде не сегментирует; прямо все слово "кусочком" и распознает. Правда, им проще - у них слов больше, но форм каждого слова существенно меньше.

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.10.2009, 06:52 
Pavia
Ал-м сегментации - процесс выделения отдельных букв в слове?

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.10.2009, 12:57 
Аватара пользователя
Цитата:
Microsoft работает над технологией распознавания рукописного текста более 15 лет.
Цитата:
за 6-7 месяцев написать такую прогу студенту в одиночку, он сказал да

Где-то здесь противоречие :D

Думаю, Вам стоило бы сильно урезать потенциальные возможности Вашей будущей бакалаврской, чтобы был шанс сделать что-то работающее. Например, ограничиться случаем распознавания отдельно стоящих рукописных букв, написанных одним (хорошим) почерком и идеально очищенных от мусора. Хотя даже насчёт возможности реализации такого за 6-7 месяцев у меня есть сомнения...

Вот, к примеру, FineReader распознаёт только печатный текст и весьма чувствителен к мусору. А ведь люди за него платят.

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.10.2009, 13:06 
B7_Ruslan в сообщении #248536 писал(а):
Теперь хочу узнать мнение компетентных людей на этом форуме. Вопрос: как вы оцениваете мои шансы? Желательно аргументировать.
Требования к работе на бакалавра значительно более скромные, чем требования к магистерской или докторской диссертации. ИМХО, даже если Вы реализуете распознавание только печатного текста, для бакалавра этого будет вполне достаточно.

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.10.2009, 14:29 
Аватара пользователя
B7_Ruslan
По поводу рукописного текста. Существует 2 метода ввода рукописного текста.

1) Бумага и ручка, а затем оцифровка при помощи сканера\фотика.
2) Использовать манипулятор для прямого ввода текста в компьютер. Мышь или сенсорный экран и тд.

Собственно насколько я знаю 2 вариант гораздо проще для распознавания и в майкрософт занимаются именно им.

Собственно предлагаю автору остановится на нем. А потом если время останется то перейти к 1.


Цитата:
Ал-м сегментации - процесс выделения отдельных букв в слове?
Вначале хотя бы слова.

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.10.2009, 18:25 
Аватара пользователя
B7_Ruslan, нереально. Поверьте тем, кто занимается этим профессионально. В одиночку за такой срок без опыта решения подобных задач (обработка данных, машинное обучение и работа с изображениями) - нереально. Перед Вами встанет большое количество задач самого разного характера, как технических, так и содержательных, каждая из которых может потребовать несколько месяцев серьезной работы. В итоге теоретически возможно, что путем неимоверных усилий Вы сумеете к сроку создать что-то работающее, но работать оно будет плохо и фактически только на обучающем материале. Это может быть станет и неплохим опытом лично для Вас, но со стороны будет смотреться скорее всего весьма кустарно. И в любом случае потребует от Вас такой самоотдачи все эти месяцы, что может в дальнейшем начисто отбить у Вас охоту к дальнейшему движению в этом направлении.
Еще нужно отметить, что данная задача требует реально много обучающего материала. Очень много, измеряемого минимум десятками тысяч. Девочки даже с хорошим почерком Вам его не смогут обеспечить, так как уже минут через 15 непрерывного написания почерк уже будет не таким хорошим, а минут через 40 пойдут такие каракули, которые даже человек с трудом прочтет.
Пока Вы не очень представляете себе ни специфики задачи, ни свои возможности в этой задаче, лучше ставить перед собой более скромные и реальные цели, а достигнув их - двигаться дальше.
Рекомендую для начала заняться более простыми задачами. Поищите такие, которые описаны в литературе. Для многих стандартных задач можно найти учебные базы данных, на которых можно учить системы. В статьях Вы найдете подходы, которые можно будет применить, если у Вас возникнут сложности. Это даст Вам хороший список литературы, что повысит работу в глазах критиков. Кроме того, на таких задачах Вы сможете сравнить эффективность Вашего метода с известными результатами, что всегда полезно - хоть какая-то объективная оценка. Когда Вы будете защищать работу, то Вас обязательно спросят о том, как соотносятся Ваши результаты с известными.

В качестве хорошей задачи могу предложить, например, распознавание отдельных рукописных цифр. По этой ссылке Вы найдете базу данных для обучения: 60 тысяч train и 10 тысяч test images. Также приводится таблица результатов разных авторов на этой базе: начиная от 12% ошибки в 98 году и заканчивая десятыми долями процента ошибки в этом году. Можете попробовать за 2-3 месяца поработать с этой базой вслепую, не читая описаний походов других, и посмотреть, чего получится добиться. Если ничего не будет получаться, то всегда остается возможность взять статьи, которые тут же приведены, и реализовать подходы, примененные авторами. Кроме того, Вы наверняка найдете еще базы данных, которые можно добавить к этой для лучшего обучения.

Можете поискать и другие задачи, но в любом случае настоятельно советую в качестве ориентира брать такие, к которым уже есть базы данных и какие-то подходы и известные результаты, с которыми можно сравниваться.

Успехов.

-- Сб окт 03, 2009 19:31:57 --

Если у Вас быстро получится успешно решить данную задачу, то можно будет ее усложнить, приближая к реальным условиям. Например, наложить на изображение различные шумы различного характера. А также - распознавать последовательности цифр (это будет уже ближе к задачам работы с реальным текстом), например, денежные суммы на платежных документах.

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.10.2009, 20:01 
Parascript
Спасибо за ответ.
Возьмусь за распознавание цифр.

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение04.10.2009, 01:39 
Аватара пользователя
B7_Ruslan в сообщении #248783 писал(а):
Parascript
Спасибо за ответ.
Возьмусь за распознавание цифр.

Сначала возьмитесь за какую-нибудь более скромную задачу, которая полезна не только при распознавании цифр, например, распознавание пересечения линий. Кстати, задача не такая элементарная.

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение11.10.2009, 11:43 
B7_Ruslan в сообщении #248783 писал(а):
Parascript
Спасибо за ответ.
Возьмусь за распознавание цифр.

Может быть это Вам поможе
ABBYY FormReader - система ввода форм, заполненных от руки или на принтере, с применением технологии ICR (Intelligent Character Recognition).
А с текстом, написанным от руки (правда по-английски, но много - >2000 стр.) я могу помочь.

 
 
 
 Re: Распознавание рукописного текста в качестве бакалаврской...
Сообщение03.11.2009, 16:19 
В репозитории UCI есть несколько баз рукописных символов.
Например,
http://archive.ics.uci.edu/ml/datasets/Pen-Based+Recognition+of+Handwritten+Digits.

 
 
 [ Сообщений: 17 ]  На страницу 1, 2  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group