2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу 1, 2, 3, 4, 5, 6  След.
 
 Семантическая и другие виды информации
Сообщение04.04.2015, 09:09 


15/04/10
985
г.Москва
Прошло 5 лет и опять возвращаюсь к обсуждению понятия семантической и других видов информации.
см http://dxdy.ru/topic56653.html
Ну не знаю. Как-то неудачно преподают ее что-ли. Во всех практически учебниках информатики в разделе семантической информации грубо говоря излагается 3 факта
1)семантическая информация связана с тезаурусом человека или ЭС.т.е. она индивидуальна по отношению к потребителю
2)приводится стандартный качественный (без попыток каких то- конкретных примеров аналитического описания
график зависимости количества семантической информации Ic от тезауруса пользователя Sp
(при этом каких-то попыток оценить количественно этот самый тезаурус пользователя не делается)
3)вводят Относительную меру количества семантической информации - коэф-т содержательности C,
определяя его как отношение количества семантической информации к ее объему: $C=I_c/V_d$
------------------------------------------------------------------------------------------------------------
Не говоря уже о том что при таких расплывчатых определениях ни мне уже около 10 лет пытающегося учиться и преподавать информатику ни другим невозможно понять точное определение этого, ни тем более закрепить его на примерах. (т к примеров расчета столь полезных для закрепления понятий в других областях наук просто не существует).
Привожу мнение модератора форума PAV,которого уважаю и доверяю.http://dxdy.ru/topic56653.html
"Лично я считаю данную тему бессодержательной и неинтересной.имеется система целей или задач, которые стоят перед объектом. Имеются вероятности достижения этих целей. Все, что повышает эти вероятности - это польза. Ее можно теоретически измерить..."
----------------------------------------------------------------------------------------------------------------------
Лично мне не совсем понятно еще и полная система классификации видов информации принятая в теории информациию
обычнно кратко-говорится о 3 подходах (в абзаце ниже я считаю синонимами термины Структурный (объемный) и Статистический(Энтропийный) подходы
1)Структурный (объемный) - рассм дискретное строение массивов информации и их измерение простым подсч информац элем. Объем данных $Vd$ в сообщении измеряют колич символов (разрядов) в этом сообщ
2)Статистическое направление( Энтропийный подход) -оперирует понятием энтропии как меры неопределенности,
учитывает вероятнность появл тех или иных сообщений.
3)Семантическое направление-
учитывает целесообразность, ценность или существенность информации
4)прагматический подход в основе -полезность для достижения некоторой цели
видимо в нем предлагаются меры ценности (целесообразности) А. А. Харкевича $V=P_{apost}/P_{aprior}$ (где $P_{apost},P_{aprior}$ -апостериорная и априорная (до сообщения) вероятности достижения цели. Так же подходы Карнапа, Вилькенштейна и др. см Википедию
[url]http://ru.wikipedia.org/wiki/Ценность_информации[/url]
---------------------------------------------------------------------
в отдельных случаях говорят еще об т.н. "алгоритмическом подходе" идущем может быть от Колмогорова.
Там хоть какая-то точность определений есть: "Любому сообщению можно приписать количественную характ-ку, отражающую сложность (размер) программы, ее воспроизводящей. конкретной ЭВМ, например, машиной Тьюринга. Сложность слова (сообщения) определяют как мин число внутренних состояний машины Тьюринга, требуемых для его воспроизведения.".
ОК, я не возражаю, только дайте простые примеры расчета понятные мне и школьникам.
--------------------------------------------------------------------------------------------------------------------
вопрос1) энтропийный подход
Объясните мне, чайнику. В основе энтропийного подхода лежит определение относительной информации как разности
априорной и апостериорной энтропий $I_a=H(a)-H_b (a)$т.е некот функции определяемой через вероятности. Но само понятие вероятность можно применять в разных аспектах -если вероятность появления буквы в сообщении - это алфавитный подход относящийся в классификации выше к 1) А может быть эта же самая вероятность быть применена в семантике, например в результате сообщения мы отбросили одну из нескольких гипотез о структуре объекта (уж как хотите можно считать гипотезы равновероятными или нет - это фокусы). Тогда понятие относительной информации
явно семантические. Др словами, энтропийный (вероятн-статистич) метод -не есть самостоят область а может применяться как при количественном так и семантическом подходах?

вопрос 2)Алгоритмический подход.
а)приведите примеры расчета
б)как быть если некот модели допускают несколько алгоритмов решения. Напр численные методы решения уравнений?
(в старом посте отмечал в МГУ - каф логики и теории алгоритмов" т.е. др.словами пересечение теории алгоритмов и логики в информатике видимо и есть этот самый "Алгоритмический подход" в теории информации?)

вопрос 3) Измерение информации и распознавание образов
распознавание образов считается частью искусственного интеллекта.
Только как все таки оценивать количество информации полученное в результате распознавания скажем текста?
Если распознается заведомо текст на конкр языке то не важно какой он печатный или рукописный но информационный вес букв в рамках алфавитного подхода одинаков. Никому нет дела до реальной сложности программ распознавания. Имеет значение лишь вероятности ошибочного распознавания
Опять таки, приведите пример оценки информации при решении какой-нибудь задачи распознавания

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение04.04.2015, 22:06 
Заслуженный участник
Аватара пользователя


28/09/06
10440
Опять "многа букафф" и в основном -- всё какая-то ерундень. Хотя вопрос в целом яйца выеденного не стОит. В общем:
epros в сообщении #554052 писал(а):
Так что да, способы оценки информации могут быть разными. И что отсюда следует?

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение05.04.2015, 09:14 


15/04/10
985
г.Москва
epros в сообщении #1000162 писал(а):
Опять "многа букафф" и в основном -- всё какая-то ерундень. Хотя вопрос в целом яйца выеденного не стОит. В общем:
epros в сообщении #554052 писал(а):
Так что да, способы оценки информации могут быть разными. И что отсюда следует?

Хорошо, более понятно. В музыке интерпретация музыкального произведения может быть различной, вплоть до джазовой импровизации на основе темы. И что из этого следует? Лучше вообще никак не играть, а на сцене прочитать заголовок произведения и композитора?
всякая истина конкретна. Если уважаемые основоположники теории информации хотят чему-то научить других,
то произнося тезис А, учебник должен содержать конкретные примеры тезиса- расчет количества информации.
------------------------------------------------------------------------------------------------------------------------
2)разовью чуть свой же вопрос об "алгоритмическом подходе"
Что понимать под смысловой информацией компьютерной программы?
Целью программы расчетного типа (модель) является даже не разовый расчет с некот исх данными, а методика расчета по модели. Может быть обобщение полученных результатов в виде закономерностей. Как мерять это?
А вообще то есть и системные программы. Вообще-то они тоже например утилиты реализуют некие алгоритмы.
И что же есть смысловая информация применительно к такой программе или алгоритму?
3)по вопросу о семантическом подходе мне ближе всего попытки оценивать смысловое количество информации через семантические сети. Т.е. через какие-то характеристики семантического графа - число вершин, ребер, степень связности...Однако надо не забывать что понятия могут быть сложными, т.е. вершины сети - делиться на подвершины со своими связями

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение05.04.2015, 09:27 
Аватара пользователя


21/09/12

1871
Читаем статью в Википедии "Информация". На основании её терминологии задаём вопросы.
Так лучше будет. Первый коммент ТС только ему понятен.

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение05.04.2015, 12:20 
Заслуженный участник
Аватара пользователя


28/09/06
10440
eugrita в сообщении #1000367 писал(а):
Лучше вообще никак не играть, а на сцене прочитать заголовок произведения и композитора?
Да что Вы хотите-то конкретно? А то привели какую-то свалку из подходов, добрая половина и которых -- спорная, а вторая -- не новость ...

eugrita в сообщении #1000367 писал(а):
Если уважаемые основоположники теории информации хотят чему-то научить других,
то произнося тезис А, учебник должен содержать конкретные примеры тезиса- расчет количества информации.
Для расчёта "количества информации" есть признанная всем научным миром мера Шеннона (дальнейшее развитие меры Хартли). Велосипеды изобретать не нужно. Я говорил об этом в Вашей предыдущей теме.

eugrita в сообщении #1000367 писал(а):
2)разовью чуть свой же вопрос об "алгоритмическом подходе"
Что понимать под смысловой информацией компьютерной программы?
Целью программы расчетного типа (модель) является даже не разовый расчет с некот исх данными, а методика расчета по модели. Может быть обобщение полученных результатов в виде закономерностей. Как мерять это?
Об этом я тоже говорил. Для расчёта количества любой информации ("смысловой" -- обычно говорят "полезной", или "полной", или иной) используют одну и ту же меру Шеннона. Разница только в ограничениях, накладываемых на множество возможных сообщений. Если количество полной информации рассчитывается исходя из равновероятности всех символов алфавита, то количество полезной информации рассчитывается исходя из модели возможных ситуаций.

eugrita в сообщении #1000367 писал(а):
3)по вопросу о семантическом подходе мне ближе всего попытки оценивать смысловое количество информации через семантические сети. Т.е. через какие-то характеристики семантического графа - число вершин, ребер, степень связности...Однако надо не забывать что понятия могут быть сложными, т.е. вершины сети - делиться на подвершины со своими связями
Это то же самое. Неважно каким образом описывается модель возможных ситуаций -- семантической сетью, порождающей грамматикой или любым другим способом. Всё это приводится к распределению вероятностей, к которому потом применяется мера Шеннона.

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение05.04.2015, 23:18 


15/04/10
985
г.Москва
Ну хорошо. Наконец то я четко понял что энтропийный подход шире того что трактуют в учебниках по информатике применяя при измерении информационного объема сообщения и символов в рамках алфавитного подхода.
Все дело( в терминах epros) в виде модели возможных ситуаций.
Тем более хотелось бы видеть наконец учебники с примерами расчета изменений информации с иными моделями нежели поступающий текст. Наверное должен все-таки быть разработан подход к оценки важности некоей задачи в данной предметной области и оценки важности алгоритма или программы как доли вклада в решение полное или частичное данной задачи.
Все дело в уровне строгости при знакомстве с этим. Гуманитарий может быть и удовлетворен подобным изложением, а представителю точных наук надо подать конкретно лучше на уровне методики как принято в техн.ВУЗах

А как все же с задачами распознавания и автоматической классификации? Как построить здесь эту модель полезной информации и оценивать ее изменение на основе признанной меры Шеннона?

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение06.04.2015, 07:37 


15/04/10
985
г.Москва
в доказательство могу лишь сослаться на свои же попытки поиска в интернете по запросу "Информационная энтропия" или
"примеры Информационной энтропии" -ничего интересного, (в том числе включая достаточно примитивные рефераты где рассматривается энтропия вообще, в т.ч. термодинамическая) не выпадает. Убедитесь сами

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение06.04.2015, 07:58 
Заблокирован
Аватара пользователя


07/08/06

3474
eugrita в сообщении #1000704 писал(а):
А как все же с задачами распознавания и автоматической классификации? Как построить здесь эту модель полезной информации и оценивать ее изменение на основе признанной меры Шеннона?

Информация - мера устранения неопределённости. Например, минимальное количество вопросов вида "Да/Нет", позволяющее узнать всё об интересующем объекте. (Не знаю, может это было - не читал подробно Ваши темы.) Мне такой подход кажется понятным. Если Вы и так знаете всё об объекте, то новые вопросы Вам никакой информации не принесут.

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение06.04.2015, 10:28 
Заслуженный участник


09/05/08
1155
Новосибирск
AlexDem в сообщении #1000768 писал(а):
Информация - мера устранения неопределённости. Например, минимальное количество вопросов вида "Да/Нет", позволяющее узнать всё об интересующем объекте. (Не знаю, может это было - не читал подробно Ваши темы.) Мне такой подход кажется понятным. Если Вы и так знаете всё об объекте, то новые вопросы Вам никакой информации не принесут.
Без должных уточнений такой подход выглядит неадекватным. Разве при таком подходе — чисто формально — не получится, что все конечные объекты имеют «информационную меру», равную единице? Вроде, всегда найдется достаточно длинный и навороченный вопрос такой, что положительный ответ на него будет означать, что вы все знаете о данном конечном объекте.

(Простите, что непрофессионально встрял. На секунду заглянул в тему ради праздного любопытства. Если что, больше не буду.)

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение06.04.2015, 10:38 
Заслуженный участник
Аватара пользователя


28/09/06
10440
AGu в сообщении #1000782 писал(а):
Вроде, всегда найдется достаточно длинный и навороченный вопрос такой, что положительный ответ на него будет означать, что вы все знаете о данном конечном объекте.
Как Вам поможет навороченность вопроса, если ответ может быть только "да" или "нет"? В такой ситуации эффективнее задавать как раз не навороченные вопросы, а такие, предполагаемые варианты ответов на которые равновероятны.

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение06.04.2015, 10:45 
Заслуженный участник


09/05/08
1155
Новосибирск
epros в сообщении #1000785 писал(а):
AGu в сообщении #1000782 писал(а):
Вроде, всегда найдется достаточно длинный и навороченный вопрос такой, что положительный ответ на него будет означать, что вы все знаете о данном конечном объекте.
Как Вам поможет навороченность вопроса, если ответ может быть только "да" или "нет"?
Вроде, поможет. Фактически речь идет о познании объектов методом проверки гипотез. Ну вот, я формулирую очень пространную гипотезу, что данный объект устроен так-то и так-то и никак иначе, перечисляю все мыслимые детали (их ведь конечное число, так что это в принципе возможно), излагаю все это в нескольких миллионах книжных томов, и спрашиваю оракула, соответствует ли моя гипотеза действительности. Получив в ответ «да», я испускаю дух.

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение06.04.2015, 11:00 
Заслуженный участник
Аватара пользователя


01/09/13
4319
AGu в сообщении #1000786 писал(а):
Получив в ответ «да», я испускаю дух.

Не надо - представим, что исследуемый объект это последовательность из 1000 равнослучайных нулей и единиц. :-)

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение06.04.2015, 12:20 
Заслуженный участник
Аватара пользователя


28/09/06
10440
AGu в сообщении #1000786 писал(а):
epros в сообщении #1000785 писал(а):
Как Вам поможет навороченность вопроса, если ответ может быть только "да" или "нет"?
Получив в ответ «да», я испускаю дух.
Забавный вариант. :-) Но лучше посчитайте энтропию и убедитесь, что информационная ценность вопроса, вероятность ответа "да" на который составляет $10^{-9}$, гораздо меньше одного бита...

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение06.04.2015, 13:00 
Заслуженный участник


27/04/09
28128

(Оффтоп)

Немного испорчу ситуацию: как известно, информационная энтропия «сама по себе» для дискретных случайных величин определена только лишь из-за того что есть с тем же носителем величина с таким распределением, что условная и. энтропия остальных по отношению к ней достигает наибольшего значения в ней и только. А для случайных величин, скажем, на $\mathbb R$, такого «равномерного» распределения нет, и энтропия для них имеет нехорошие свойства.

А так я мимо проходил и изъясниться понятнее не смогу — лень искать то место, где читал, чтобы вспомнить, что же там такое. (Так что смело ругайте, если захочется.)

 Профиль  
                  
 
 Re: Семантическая и другие виды информации
Сообщение06.04.2015, 14:28 
Заслуженный участник
Аватара пользователя


28/09/06
10440
arseniiv в сообщении #1000822 писал(а):
А для случайных величин, скажем, на $\mathbb R$, такого «равномерного» распределения нет, и энтропия для них имеет нехорошие свойства
Всё верно. И не только на $\mathbb R$, но даже и на $\mathbb Q$ проблема с "равномерным распределением" имеет место быть. Решается она, насколько я знаю, только неким волюнтаристским образом: Аксиоматическим признанием некоего распределения за "самое равномерное" (или что-то в этом роде). :wink:

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 83 ]  На страницу 1, 2, 3, 4, 5, 6  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group