2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Распознавание образов с т.зр. подходов к информации
Сообщение01.12.2018, 03:04 


15/04/10
985
г.Москва
1)В какой раздел теории информации воткнуть задачу распознавания образов?
Конкретно, распознавание рукописных текстов и распознавание изображений?
(например, нейросетевые алгоритмы)
Входными данными и там и там являются битовые матрицы изображений - хоть букв, хоть картинок
Выходными данными - либо слово либо картинка. Одно слово не несет смысловой информации
Но если распознанный текст является, например адресом доставки посылки или нейросеть распознает треугольник, мы получаем какое-то знание уменьшая неопределенность.
Распознание слова или картинки аналогично декодированию - по набору бит получаем исходное сообщение
или элемент рисунка, не вдаваясь в его смысл.
Но в условиях когда тех же самых слов конечное число,(т е слово является символом нового алфавита и обозначает некую альтернативу ,например погода яная, пасмурная, дождливая, или цвет сигнала светофора-
или красный или желтый или зеленый). То распознав альтернативу - уменьшаем неопределенность и тем самым получаем информацию

Но то же можно сказать и про классическую теорию приема сообщений
-принятое текстовое сообщение, например, телеграмма может не иметь смысла ни для кого, кроме получателя. Так же , если например, робот обученный распознаванию изображений не будет получать информации смотря телевизор (или принимая его битовые образы) если например - это какая то телепередача. Но наоборот получит смысловую информацию, если это изображение - одно из альтернатив, например, цвет того же светофора или стандартный сигнал вахтенного с корабля. Потому что есть конечный набор конкретных сигналов, и отсебятины здесь не может быть

Собственно по этому принципу построено и распознание бита - 2 альтернативы 1- сигнал выше порога, 0- сигнал ниже порога. Но от распознания бита смысловая информация =0 кроме когда этим да-нет придается априори смысл. Например, 0-завтра холодно, 1- завтра жарко

2)Очень трудно найти грань отделяющий сообщение как последовательность символов без смысла (алфавитный подход) от подхода Шеннона -уменьшения неопределенности а от нее к настоящей семантике,
когда по принятому декодированному и/или расшифрованному тексу строится модель знаний. Т.е. одно и то же утверждение можно выразить немного разным текстом, разными сообщениями а модель знаний - одна инвариантная
-------------------------------------------------------------
Итак, основной вопрос: C позиций подходов к понятию информации -алфавитного, вероятностного (Шеннона), семантического
чем является процесс распознавания образов в любом его виде?

Я может что-то неправильно представляю? Поправьте

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение01.12.2018, 03:20 
Заслуженный участник


27/04/09
28128
Может быть, ничем. Распознавание образов — это ведь разнообразные задачи с множеством разных формализаций, по-разному подходящих к разным. Вряд ли кто-то даст на это ответ, слишком отвлечённо. Разве что банальную оценку сверху дать, что мы не можем получить больше информации, чем в распознаваемой штуке.

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение01.12.2018, 09:37 


19/03/16

114
eugrita в сообщении #1357901 писал(а):
Итак, основной вопрос: C позиций подходов к понятию информации -алфавитного, вероятностного (Шеннона), семантического
чем является процесс распознавания образов в любом его виде?
arseniiv в сообщении #1357902 писал(а):
Вряд ли кто-то даст на это ответ, слишком отвлечённо.
Попробую дать ответ на "главный вопрос жизни, вселенной и всего такого".
Вообще-то это классификация. Классификация чего? Классификация конкретных моделей в пространстве моделей.
А вот конкретные методы и способы, и алгоритмы могут быть действительно весьма различны.
eugrita в сообщении #1357901 писал(а):
1) В какой раздел теории информации воткнуть задачу распознавания образов?
Затруднение вашей классификации происходит по причине того, что нет внятного определения понятия информации, затруднения являются следствием этой причины.

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение01.12.2018, 10:30 


27/08/16
9426
eugrita в сообщении #1357901 писал(а):
смысловой информации
Не помню у Шеннона определения этого понятия. Пожалуйста, напишите его сами.

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение02.12.2018, 23:14 


15/04/10
985
г.Москва
realeugene в сообщении #1357918 писал(а):
eugrita в сообщении #1357901 писал(а):
смысловой информации
Не помню у Шеннона определения этого понятия. Пожалуйста, напишите его сами.

У Шеннона вроде действительно нет понятия семантической информации )того что в современных учебниках щколы называют семантическим подходом. Подход Шеннона (совр термин - вероятностный) - оценка полученной информации как уменьшение меры неопределенности.
Теории в рамках семантического подхода (если верить изложению некоторых авторов) это теория Бар-Хиллела и Карнапа -основанная на понятии логическая вероятность , индуктивная вероятность [url]https://ru.wikipedia.org/wiki/Логическая_вероятность[/url] которые зависят от некоторой системы знаний.
Видимо семантическим подходом является и построение семантической сети некоторой области, представленной графом где вершины- понятия, ребра-отношения между ними. И база знаний экспертной системы с набором понятий и правилами вывода
-----------------------------------------------------------------------------------
Но видимо зря затеяно такое сложное обсуждение в связи с привязкой к описанным выше алгоритмам распознавания.
Эта классификация - сама по себе, распознавание -тоже.
Распознавание изображения видимо сродни декодированию. На выходе получаем либо символ алфавита (наподобие обычного декодирования текста) либо стандартный тип изображения, являющегося в свою очередь, буквой (распознавание рукописных текстов) или элементом некоторого множества альтернатив или символов. (например иероглиф может обозначать слово или понятие или альтернативу множества) в 1 случае имеем дело с алфавитным подходом, во 2-3 случаях видимо с вероятностным - узнав альтернативу -уменьшили неопределенность.

Поэтому если не будет оригинальных мнений - обсуждение закрываю.Это скорее вопрос философский- какую информацию распознаем. А вся сложность алгоритмов распознавания всех видов -в них самих, и главный критерий -точность распознавания а не какую информацию. Каждый выбирает для себя интерес в рамках какого подхода ему работать в информатике. На мой взгляд гораздо интереснее ковыряться в интерпретации информации как знания, соответственно занимаясь экспертными системами, искусств интеллекта чем уподобиться простому счетчику количества информации в рамках алфавитного подхода. (К чему видимо призывают на страницах своих учебников и задач ЕГ их авторы!)

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение02.12.2018, 23:41 


27/08/16
9426
В рамки Шенноновской теории передачи информации распознавание текста, очевидно, запихнуть можно. Некто формирует текстовое сообщение. Печатный текст - это канал передачи этого сообщения. Один из этапов этого канала связи - сканирование текста (и всё вовсе не начинается уже с битовых массивов). OCR - это приёмник, его цель - минимизировать количество ошибок распознавания в распознанном тексте на один символ исходного текста. Т. е. ошибки распознавания - это добавленный рассматриваемым каналом связи (неаддитивный) шум.

Как запихнуть это всё в рамки других походов к информации, и осмысленны ли эти подходы - понятия не имею.

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение03.12.2018, 09:37 


15/04/10
985
г.Москва
Ну естественно. сначала сканирование текста или изображения. Но дальше насколько знаю, алгоритм распознавания работает с форматом полученного графического изображения (которые разработчики форматов часто засекречивают), влезает в его матрицу пикселов и собственно это и является входными данными алгоритмов распознавания (которые естественно ноу-хау)

 Профиль  
                  
 
 Re: Распознавание образов с т.зр. подходов к информации
Сообщение03.12.2018, 10:54 


27/08/16
9426
eugrita в сообщении #1358377 писал(а):
и собственно это и является входными данными алгоритмов распознавания
Но канал связи по Шеннону начинается формированием текста на бумаге и заканчивается его распознаванием.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 8 ] 

Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: Mikhail_K


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group