2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Распознавание образов с т.зр. подходов к информации
Сообщение01.12.2018, 03:04 


15/04/10
985
г.Москва
1)В какой раздел теории информации воткнуть задачу распознавания образов?
Конкретно, распознавание рукописных текстов и распознавание изображений?
(например, нейросетевые алгоритмы)
Входными данными и там и там являются битовые матрицы изображений - хоть букв, хоть картинок
Выходными данными - либо слово либо картинка. Одно слово не несет смысловой информации
Но если распознанный текст является, например адресом доставки посылки или нейросеть распознает треугольник, мы получаем какое-то знание уменьшая неопределенность.
Распознание слова или картинки аналогично декодированию - по набору бит получаем исходное сообщение
или элемент рисунка, не вдаваясь в его смысл.
Но в условиях когда тех же самых слов конечное число,(т е слово является символом нового алфавита и обозначает некую альтернативу ,например погода яная, пасмурная, дождливая, или цвет сигнала светофора-
или красный или желтый или зеленый). То распознав альтернативу - уменьшаем неопределенность и тем самым получаем информацию

Но то же можно сказать и про классическую теорию приема сообщений
-принятое текстовое сообщение, например, телеграмма может не иметь смысла ни для кого, кроме получателя. Так же , если например, робот обученный распознаванию изображений не будет получать информации смотря телевизор (или принимая его битовые образы) если например - это какая то телепередача. Но наоборот получит смысловую информацию, если это изображение - одно из альтернатив, например, цвет того же светофора или стандартный сигнал вахтенного с корабля. Потому что есть конечный набор конкретных сигналов, и отсебятины здесь не может быть

Собственно по этому принципу построено и распознание бита - 2 альтернативы 1- сигнал выше порога, 0- сигнал ниже порога. Но от распознания бита смысловая информация =0 кроме когда этим да-нет придается априори смысл. Например, 0-завтра холодно, 1- завтра жарко

2)Очень трудно найти грань отделяющий сообщение как последовательность символов без смысла (алфавитный подход) от подхода Шеннона -уменьшения неопределенности а от нее к настоящей семантике,
когда по принятому декодированному и/или расшифрованному тексу строится модель знаний. Т.е. одно и то же утверждение можно выразить немного разным текстом, разными сообщениями а модель знаний - одна инвариантная
-------------------------------------------------------------
Итак, основной вопрос: C позиций подходов к понятию информации -алфавитного, вероятностного (Шеннона), семантического
чем является процесс распознавания образов в любом его виде?

Я может что-то неправильно представляю? Поправьте

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение01.12.2018, 03:20 
Заслуженный участник


27/04/09
28128
Может быть, ничем. Распознавание образов — это ведь разнообразные задачи с множеством разных формализаций, по-разному подходящих к разным. Вряд ли кто-то даст на это ответ, слишком отвлечённо. Разве что банальную оценку сверху дать, что мы не можем получить больше информации, чем в распознаваемой штуке.

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение01.12.2018, 09:37 


19/03/16

114
eugrita в сообщении #1357901 писал(а):
Итак, основной вопрос: C позиций подходов к понятию информации -алфавитного, вероятностного (Шеннона), семантического
чем является процесс распознавания образов в любом его виде?
arseniiv в сообщении #1357902 писал(а):
Вряд ли кто-то даст на это ответ, слишком отвлечённо.
Попробую дать ответ на "главный вопрос жизни, вселенной и всего такого".
Вообще-то это классификация. Классификация чего? Классификация конкретных моделей в пространстве моделей.
А вот конкретные методы и способы, и алгоритмы могут быть действительно весьма различны.
eugrita в сообщении #1357901 писал(а):
1) В какой раздел теории информации воткнуть задачу распознавания образов?
Затруднение вашей классификации происходит по причине того, что нет внятного определения понятия информации, затруднения являются следствием этой причины.

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение01.12.2018, 10:30 


27/08/16
9426
eugrita в сообщении #1357901 писал(а):
смысловой информации
Не помню у Шеннона определения этого понятия. Пожалуйста, напишите его сами.

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение02.12.2018, 23:14 


15/04/10
985
г.Москва
realeugene в сообщении #1357918 писал(а):
eugrita в сообщении #1357901 писал(а):
смысловой информации
Не помню у Шеннона определения этого понятия. Пожалуйста, напишите его сами.

У Шеннона вроде действительно нет понятия семантической информации )того что в современных учебниках щколы называют семантическим подходом. Подход Шеннона (совр термин - вероятностный) - оценка полученной информации как уменьшение меры неопределенности.
Теории в рамках семантического подхода (если верить изложению некоторых авторов) это теория Бар-Хиллела и Карнапа -основанная на понятии логическая вероятность , индуктивная вероятность [url]https://ru.wikipedia.org/wiki/Логическая_вероятность[/url] которые зависят от некоторой системы знаний.
Видимо семантическим подходом является и построение семантической сети некоторой области, представленной графом где вершины- понятия, ребра-отношения между ними. И база знаний экспертной системы с набором понятий и правилами вывода
-----------------------------------------------------------------------------------
Но видимо зря затеяно такое сложное обсуждение в связи с привязкой к описанным выше алгоритмам распознавания.
Эта классификация - сама по себе, распознавание -тоже.
Распознавание изображения видимо сродни декодированию. На выходе получаем либо символ алфавита (наподобие обычного декодирования текста) либо стандартный тип изображения, являющегося в свою очередь, буквой (распознавание рукописных текстов) или элементом некоторого множества альтернатив или символов. (например иероглиф может обозначать слово или понятие или альтернативу множества) в 1 случае имеем дело с алфавитным подходом, во 2-3 случаях видимо с вероятностным - узнав альтернативу -уменьшили неопределенность.

Поэтому если не будет оригинальных мнений - обсуждение закрываю.Это скорее вопрос философский- какую информацию распознаем. А вся сложность алгоритмов распознавания всех видов -в них самих, и главный критерий -точность распознавания а не какую информацию. Каждый выбирает для себя интерес в рамках какого подхода ему работать в информатике. На мой взгляд гораздо интереснее ковыряться в интерпретации информации как знания, соответственно занимаясь экспертными системами, искусств интеллекта чем уподобиться простому счетчику количества информации в рамках алфавитного подхода. (К чему видимо призывают на страницах своих учебников и задач ЕГ их авторы!)

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение02.12.2018, 23:41 


27/08/16
9426
В рамки Шенноновской теории передачи информации распознавание текста, очевидно, запихнуть можно. Некто формирует текстовое сообщение. Печатный текст - это канал передачи этого сообщения. Один из этапов этого канала связи - сканирование текста (и всё вовсе не начинается уже с битовых массивов). OCR - это приёмник, его цель - минимизировать количество ошибок распознавания в распознанном тексте на один символ исходного текста. Т. е. ошибки распознавания - это добавленный рассматриваемым каналом связи (неаддитивный) шум.

Как запихнуть это всё в рамки других походов к информации, и осмысленны ли эти подходы - понятия не имею.

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение03.12.2018, 09:37 


15/04/10
985
г.Москва
Ну естественно. сначала сканирование текста или изображения. Но дальше насколько знаю, алгоритм распознавания работает с форматом полученного графического изображения (которые разработчики форматов часто засекречивают), влезает в его матрицу пикселов и собственно это и является входными данными алгоритмов распознавания (которые естественно ноу-хау)

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение03.12.2018, 10:54 


27/08/16
9426
eugrita в сообщении #1358377 писал(а):
и собственно это и является входными данными алгоритмов распознавания
Но канал связи по Шеннону начинается формированием текста на бумаге и заканчивается его распознаванием.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 8 ] 

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group