2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4, 5, 6
 
 Re: Информация и ее измерение
Сообщение28.08.2013, 20:11 


06/09/12
890
Lev65 в сообщении #758510 писал(а):
Открыв ящик Шеннона вы ведь можете так и не снять неопределенность

То есть как? Открыв ящик, я не смогу разобраться, что же там с монетой?! А как Вы тогда одежду из шкафа достаете и не боитесь не разобраться, Ваше это или Вашей второй половины? Вы приведите уже наконец пример, когда неопределенность в каком-либо вопросе исчезает, а информация при этом не возникает.

 Профиль  
                  
 
 Re: Информация и ее измерение
Сообщение28.08.2013, 20:32 
Заслуженный участник


27/04/09
28128
Lev65 в сообщении #758510 писал(а):
Открыв ящик Шеннона вы ведь можете так и не снять неопределенность - т.е. вверх или вниз орлом монета там располагается.Например, когда монета стоит на ребре нельзя утверждать,что монета расположена в ящике орлом вверх,так же,как нельзя утверждать,что она расположена там орлом вниз.
Вы путаете модель и реальность. Открыв ящик, можно вообще активировать бомбу, которая там внезапно оказалась. Никто не запрещает сделать сколь угодно подробную модель, содержащую и монету, вставшую на ребро, и монету, растворившуюся в кислоте. Возможность неприменимости модели её внутренних свойств не меняет.

 Профиль  
                  
 
 Re: Информация и ее измерение
Сообщение30.08.2013, 18:20 


26/09/11
37
statistonline:Позвольте,но вы то ведь хотели разрешить неопределенность с монеткой в ящике не в отношении некого достаточного большого множества вариантов (см. ваши посты). Вы задали конкретное множество из двух вариантов (орел или решка). Ну а я,соответственно, вам продемонстрировал примером,что эту неопределенность вы,открыв ящик,можете и не разрешить...

Можно конечно перейти и к разбору других примеров,но пример с ящиком Шенона,помимо его привлекательности классической известностью,на мой взгляд,далеко не исчерпан...Поэтому предлагаю не путаться,перепрыгивая с примера на пример,а продолжить тему с этим примером...

-- 30.08.2013, 19:45 --

arseniiv:Я рассмотрел именно ту модель,которая была задана автором - закрытый ящик с конкретной неопределенностью "орел" или "решка". Да,действительно,можно составить множество вариантов состояния монетки в ящике - орел,решка,на ребре,растворенная в кислоте,ну и так дальше...Но дело то в том,что этот ваш список состояний монетки априори всегда будет конечным. В то же время,если вдуматься, множество состояний монетки в ящике бесконечно! Следовательно,открывая ящик Шенона со сколь угодно подробным списком возможных состояний монетки в руках,мы всегда рискуем увидеть вариант,который в этом списке отсутствует...

 Профиль  
                  
 
 Re: Информация и ее измерение
Сообщение30.08.2013, 22:06 
Заслуженный участник


27/04/09
28128
Lev65 в сообщении #759035 писал(а):
Но дело то в том,что этот ваш список состояний монетки априори всегда будет конечным. В то же время,если вдуматься, множество состояний монетки в ящике бесконечно! Следовательно,открывая ящик Шенона со сколь угодно подробным списком возможных состояний монетки в руках,мы всегда рискуем увидеть вариант,который в этом списке отсутствует...
Ничто не мешает сделать список состояний монеты таким: «орёл, решка, ребро, растворилась, другое». Отсутствующий вариант получить не удастся.

 Профиль  
                  
 
 Re: Информация и ее измерение
Сообщение03.09.2013, 05:45 
Аватара пользователя


22/09/09

1907
Определение:
Цитата:
Спекуляция — в философии это отвлечённое рассуждение, тип теоретического знания, которое выводится без обращения к опыту («спекулятивное суждение»).

Википедия: Спекуляция (философия)
На мой взгляд, данное обсуждение носит слишком спекулятивный характер. (Начал с определения, чтобы никому не показалось обидным слово «Спекуляция» :-) )

Попробуем обратиться к опыту. Пусть студентам дано задание: написать программу на языке высокого уровня (ЯВУ), которая читает на входе число, а на выходе печатает исходное число и его квадрат. Первый студент достаточно освоил программирование, чтобы выполнить такое примитивное задание без посторонней помощи. Второй студент «пошарил по сетке» и скачал мою программу.

Рассмотрим эти программы как информационные сообщения и отметим следующие особенности:

1) Вероятность того, что их исходные тексты совпадают, очень мала.
2) И мала вероятность, что совпадают исполняемые файлы.
3) Количество информации в исходном и исполняемом коде разные.
4) Эти сообщения многоцелевые: первая цель – удобочитаемый человеком исходный код, снабженный комментариями, объясняющими назначение использованных переменных и операторов $+$ ФИО студента (второму студенту не забыть стереть мой копирайт :-) ), служебная информация для компилятора (нпр., директивы оптимизации, отладки) и т.д.; вторая цель – получение исполняемого кода.

Итак, имеем два несовпадающих сообщения, приводящих к одним и тем же результатам:

1) для одинаковых данных программы выдают одинаковые результаты (с точностью до погрешности округления, м.б. разной)
2) оба студента получают зачет.

Отсюда:

- вывод 1: многоцелевой характер сообщений не дает возможность просто (одной цифрой) выразить ценность информации, т.е. для какой-то цели часть информации может иметь нулевую цену. Например, компилятору комментарии (кроме директив) не нужны. Но они могут очень помочь студенту (особенно второму) на сдаче зачета объяснить преподавателю что и как делает его программа.

- вывод 2: количество информации не может дать однозначной оценки знаний студента. Действительно, позаимствованная у меня вторым студентом программа работает правильно, но это не значит, что студент достоин зачета. Если студент вдумался и разобрался, то достоин. (Чтобы проверить знания, преподаватель может попросить студентов зациклить их программы, т.е. чтобы можно было вводить числа не перезапуская, а, получив число 0 на входе, программа заканчивала счет.) Первый студент мог плохо отформатировать исходный текст, а второй навести красоты: поставить свою фамилию в рамочку, добавить пустые строки. Первому стоит сделать замечание, а второго похвалить за оформление, но на результат зачета такая дополнительная информация повлиять не должна.

- вывод 3: в реальности сообщения не изолированы от окружающей среды и при преобразовании сообщений используется дополнительная информация, точное количество которой оценить в общем случае невозможно. Так, объясняя работу своей программы, студенты используют знания, которые они получили в ходе занятий и самостоятельной подготовки. При переводе сообщения с ЯВУ в инструкции процессора используются знания (правила), заложенные в компилятор и т.д.

- вывод 4: даже исходный код на ЯВУ нельзя назвать формальным. При том, что ЯВУ – формальный язык, комментарии пишут на естественном неформальном языке (ср. с математическим текстом: кроме формул там еще обычно бывают слова естественного языка, т.о. язык математики строго формальным не является).

- вывод 5: высказанные в данном обсуждении претензии к Шеннону и к computer sci. несправедливы. С тем же успехом можно высказать претензии к математике и к любой другой науке, что не все ее цели достигнуты и не все задачи решены.

Эти выводы можно сделать и из стартового примера:
eugrita в сообщении #552059 писал(а):
Как например мерять изменение знаний студента по математике когда ему прочли новую теорему?
1й студент просто заучил и не может ни к чему применять. У него должна быть одна мера
2-й студент переварил эту же теорему творчески. Посмотрел применимость порешал задачки. Появилось знание о ее применимости и мастерство решения в классе задач.
«переварил эту же теорему творчески» - т.е. использовал дополнительную информацию, полученную им ранее при изучении математики, «порешал задачки» - опять доп. информация… От студента требуют не просто знания новой теоремы, а чтобы эта теорема вошла в систему его мат.знаний. Если знания не систематизированы, то и "переварить" новую теорему этот студент не сможет. Проблема в оценке систематичности знаний студента, а не в количестве байтов текста теоремы.

PS BTW:
eugrita в сообщении #552548 писал(а):
Вопросами выделения знаний из информации сейчас занимаются такие направления как"искусственный интеллект","инженерия знаний", проблемно-ориентированные "экспертные системы но никак не информатика.
AI - часть computer sci.

 Профиль  
                  
 
 Re: Информация и ее измерение
Сообщение03.09.2013, 10:22 
Заслуженный участник


27/04/09
28128
bin в сообщении #760023 писал(а):
- вывод 4: даже исходный код на ЯВУ нельзя назвать формальным. При том, что ЯВУ – формальный язык, комментарии пишут на естественном неформальном языке (ср. с математическим текстом: кроме формул там еще обычно бывают слова естественного языка, т.о. язык математики строго формальным не является).
Ерунда какая. Комментарии не влияют на смысл кода и их можно спокойно выкинуть. Сравнение с языком математики совершенно неаналогичное — в языке математики словам приравнивается вполне определённый смысл и их нельзя выкинуть без потери смысла для всех математических текстов (можно написать, конечно, текст без слов, достаточно повозившись с кучей обозначений вместо них — в таком тексте без слов выкидывание слов ничего не изменит).

 Профиль  
                  
 
 Re: Информация и ее измерение
Сообщение03.09.2013, 11:19 
Аватара пользователя


22/09/09

1907
arseniiv в сообщении #760053 писал(а):
Ерунда какая. Комментарии не влияют на смысл кода и их можно спокойно выкинуть.
Ну вот, сразу "ерунда"! У нас здесь нормальное обсуждение или где? ;-) Для нормального обсуждения стоит сначала попытаться понять, прежде чем ругать и навешивать подобные дефиниции... А выкидывать комменты из исходного кода не советуют - они вроде бы не влияют на смысл, но без них он становится трудноуловим для человека:
Цитата:
Все может быть!
Быть может, вы умрете,
Вас выгонят,
Сгорите на работе,
Или на базе вас задавит свеклой в таре…
Товарищи! Пишите комментарий!

Леонид Бунич
Так же трудноуловим будет и нетривиальный мат.текст без слов естественого языка, если вообще такое возможно - далеко не все обозначения приведены к единому стандарту... Как бы то ни было, факт, что на данный момент подавляющее большинство мат. текстов содержит слова и фразы из этих слов, т.о. на данный момент математиками используется не строго формальный язык. (Понимание естественного языка - нерешенная задача AI.)

 Профиль  
                  
 
 Re: Информация и ее измерение
Сообщение03.09.2013, 12:21 
Заслуженный участник


27/04/09
28128
bin в сообщении #760071 писал(а):
Так же трудноуловим будет и нетривиальный мат.текст без слов естественого языка
Не так же, а по-другому. Из «i = 42; // магия» строку «// магия» можно выкинуть, не нарушив компилируемости этого тем, что понимает этот язык, а из «пусть $a$ — подмножество $b$» выкинуть «пусть <дырка> — подмножество <дырка>» нельзя, не нарушив «компилируемости» этого тем, что понимает этот язык (можно считать любой данный образец математического текста представителем какого-то определённого языка, который могут понять математики, знающие какой-то набор вещей).

То, что у программы есть какой-то смысл, не важно. Верность записанного математическим текстом утверждения тоже можно проверить формально, хотя для среднестатистического это сейчас без помощи человека не сделать. А проведение аналогии между комментариями ЯП и словами естественных языков в математическом тексте — это неразборчивость.

-- Вт сен 03, 2013 15:29:33 --

bin в сообщении #760071 писал(а):
(Понимание естественного языка - нерешенная задача AI.)
Зачем же так обобщать? Математический текст — это не любой текст.

 Профиль  
                  
 
 Re: Информация и ее измерение
Сообщение03.09.2013, 16:49 
Аватара пользователя


22/09/09

1907
arseniiv в сообщении #760080 писал(а):
«пусть $a$ — подмножество $b$» выкинуть «пусть <дырка> — подмножество <дырка>» нельзя
Верно! Нельзя! Потому что это определение типа, такое как, например:
Код:
a=set of char; // подмножество множества символов
откуда "set of" выкинуть нельзя. Речь об "избыточных" словах в мат.текстах "откуда получаем", "где" и т.д. (привел простейшие случаи, т.к. более сложные трудно обобщить). Было показано, что естественные языки обладают примерно одинаковой избыточностью ок. 60%. В принципе на эти проценты можно сократить каждый мат.текст, как и в приведенном примере выкинуть:
Код:
// подмножество множества символов
Однако столь лаконичный стиль изложения не рекомендуется для мат.текстов - см., например, Mathematical Writing by Donald E. Knuth, Tracy Larrabee, and Paul M. Roberts, p.1:
Цитата:
1. Symbols in different formulas must be separated by words.
Bad: Consider $S_q$, $q < p$.
Good: Consider $S_q$, where $q < p$.
И в программе и в мат.тексте уменьшение избыточности нарушает "компилируемость" для людей. При том что я не спорю, что всякая аналогия не точна, возражу, что излишняя разборчивость мешает обобщениям.

Да, математический текст — это не любой текст, но это текст с применением естественного языка. Этого достаточно, чтобы уяснить, что понимание такого текста сопряжено с основными проблемами понимания естественного языка. И простого синтаксического анализатора (как в обычных компиляторах) тут недостаточно. Нужно по контексту распознавать значения слов. Конечно, в мат. текстах применение слов строже, чем в худ.литературе. Но и математики нередко допускают вольности (неизбежные в естественном языке), когда, например, пишут "группа вершин" не в значении термина теории групп, а в значении "группа товарищей" ;-)
arseniiv в сообщении #760080 писал(а):
Зачем же так обобщать?
Чтобы ответить на поставленные в этой теме вопросы :-)

 Профиль  
                  
 
 Re: Информация и ее измерение
Сообщение03.09.2013, 17:26 


06/09/12
890
Lev65 в сообщении #759035 писал(а):
В то же время,если вдуматься, множество состояний монетки в ящике бесконечно! Следовательно,открывая ящик Шенона со сколь угодно подробным списком возможных состояний монетки в руках,мы всегда рискуем увидеть вариант,который в этом списке отсутствует...

Для таких ситуаций существует принцип практической уверенности. Например, в генетике уровень статистической значимости в 0,001 считается достаточным, чтобы делать выводы об отцовстве или материнстве. Если "бесконечность множества всех мыслимых исходов эксперимента" и есть аргумент против определения информации по Шеннону или почти повторяющего его определения по Винеру, то я не вижу смысла дальше это обсуждать.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 85 ]  На страницу Пред.  1, 2, 3, 4, 5, 6

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group