2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1, 2
 
 Re: Закон Ципфа - верен для для любых текстов или осмысленных?
Сообщение03.09.2015, 10:47 
Аватара пользователя


12/01/14
1127

(Оффтоп)

grizzly в сообщении #1050076 писал(а):
prof.uskov в сообщении #1050072 писал(а):
А кто мешает Вам самому внести в статью в Вики соответствующие изменения?

Либо Вы не понимаете, что atlakatl заблуждается (точнее, просто не в теме), либо это подстрекательство к вики-вандализму. Вот такая бинарная логика.

Вика - свободная энциклопедия. Любой желающий может вносить изменения. Я спросил то, что спросил и не нужно здесь искать какой-то подтекст. Ничего страшного не произойдет, если он внесет в Вику изменения и потом посмотрит реакцию других авторов.

 Профиль  
                  
 
 Re: Закон Ципфа - верен для для любых текстов или осмысленных?
Сообщение03.09.2015, 10:56 
Аватара пользователя


21/09/12

1871
grizzly в сообщении #1050067 писал(а):
atlakatl ради своей ерунды поднял трёхлетней давности тему

Поднял тему именно из-за её трёхлетности.
grizzly в сообщении #1050076 писал(а):
atlakatl заблуждается (точнее, просто не в теме)

Цитата из сабжевой статьи Википедии:
Цитата:
Американский биолог Вэньтянь Ли[en] предложил опровержение закона Ципфа, доказав

Ключевое здесь слово "доказал". Считаю, что в крайнем случае это выражение следует употребить со словом "ошибочно". - Или вообще не упоминать "американского биолога".
prof.uskov в сообщении #1050072 писал(а):
кто мешает Вам самому внести в статью в Вики соответствующие изменения?

Решил сначала увидеть реакцию участников dxdy.ru. grizzly указал, что я не прав. Жду от него конкретных аргументов.

 Профиль  
                  
 
 Re: Закон Ципфа - верен для для любых текстов или осмысленных?
Сообщение03.09.2015, 11:00 
Заслуженный участник
Аватара пользователя


09/09/14
6328

(Оффтоп)

prof.uskov в сообщении #1050094 писал(а):
Я спросил то, что спросил и не нужно здесь искать какой-то подтекст. Ничего страшного не произойдет, если он внесет в Вику изменения и потом посмотрит реакцию других авторов.

Я не ищу подтекста, я просто сообщаю Вам и аудитории своё отношение к Вашему вопросу. Сообщаю, естественно, в том виде, в котором считаю нужным.

Насчёт ничего страшного. Как часто Вы вносите правки в Вики? Я делаю это не очень часто, но я как-то решил проследить, как быстро подтверждаются "опытными пользователями" те правки, которые я вношу. Результат -- за последние 2 года не была утверждена пока ни одна. Я думаю, что "опытным пользователям" нет особого дела до около-математических тем, они больше заняты общественно-резонансными вопросами. Вы уверены, что он не забудет пойти посмотреть через пару лет, как отнеслись к его исправлениям? Или Вы возьмёте на себя труд проверить его правки самостоятельно и откатить?


-- 03.09.2015, 11:06 --

atlakatl в сообщении #1050098 писал(а):
Жду от него конкретных аргументов.

Хорошо, попробуем разобраться.
    Цитата:
    ...Вероятность случайного появления какого-либо слова длиной n в цепочке случайных символов уменьшается с ростом n в той же пропорции, в какой растёт при этом номер этого слова в частотном списке....

    atlakatl в сообщении #1050052 писал(а):
    Иными словами, утверждается, что в случайной последовательности цифр $0$ и $1$ одна из цифр будет встречаться в 2 раза чаще другой.
Объясните, пожалуйста, как Вы пришли к этому выводу. Вы уверены, что правильно понимаете значение слова "слово"?
(Заранее предупреждаю, что перевод стрелок в духе "кто-то доказал, что закон Ципфа ошибочен" я не принимаю. Я не защищаю здесь сам закон, я полагаю, что Вы не поняли сути его формулировки и, поэтому, не вправе сводить его до уровня "бреда".)

 Профиль  
                  
 
 Re: Закон Ципфа - верен для для любых текстов или осмысленных?
Сообщение03.09.2015, 11:35 
Аватара пользователя


21/09/12

1871
grizzly в сообщении #1050102 писал(а):
попробуем разобраться.
Цитата:

...Вероятность случайного появления какого-либо слова длиной n в цепочке случайных символов уменьшается с ростом n в той же пропорции, в какой растёт при этом номер этого слова в частотном списке....
atlakatl в сообщении #1050052

писал(а):
Иными словами, утверждается, что в случайной последовательности цифр $0$ и $1$ одна из цифр будет встречаться в 2 раза чаще другой. Объясните, пожалуйста, как Вы пришли к этому выводу.


К закону Ципфа - речь о частоте слов в языке - у меня нет претензий. Повторю цитату из Википедии:
Цитата:
Американский биолог... предложил опровержение закона Ципфа, доказав, что случайная последовательность символов также подчиняется закону Ципфа. Автор делает гипотетический вывод, что закон Ципфа, по-видимому, является чисто статистическим феноменом, не имеющим отношения к семантике текста.
В общих чертах доказательство этой теории состоит в следующем. Вероятность случайного появления какого-либо слова длиной n в цепочке случайных символов уменьшается с ростом n в той же пропорции, в какой растёт при этом номер этого слова в частотном списке. Потому произведение номера слова на его частоту есть константа.

Я не согласен с расширением закона Ципфа на "цепочку случайных символов".

 Профиль  
                  
 
 Re: Закон Ципфа - верен для для любых текстов или осмысленных?
Сообщение03.09.2015, 11:49 
Заслуженный участник
Аватара пользователя


09/09/14
6328
atlakatl в сообщении #1050106 писал(а):
Я не согласен с расширением закона Ципфа на "цепочку случайных символов".

Там же приводится оригинальная статья, в которой всё объясняется.

На всякий случай поясню ещё раз, почему я был недоволен. Какое бы Вы не выбрали понимание этой цитаты (хоть сколько-нибудь корректное), Вы бы не смогли получить, что "цифра "1" встречается в тексте в 2 раза чаще, чем цифра "0" -- это просто грубая ошибка. Если бы Вы сказали то же не про одну из цифр, а про одну из последовательностей "_0_" или "_1_", тогда я лучше смог бы Вас понять и объяснить, что имеется в виду.

Может быть стоит внести небольшое уточнение в Вики (я сделаю это, если придумаю ёмкое и не ухудшающее ситуацию пояснение). Но не называть это бредом -- в любом случае, сейчас в качестве такого уточнения там есть прямая ссылка на статью.

-- 03.09.2015, 12:13 --

atlakatl
Поясню в меру своего понимания. Отнеситесь к этой попытке как к первому приближению, а не как к последней инстанции.

В статье говорится о законе Ципфа применительно к длине слова, а не к отдельным словам. Причём автор использует при этом некоторую методику обрезания лишнего и рассматривает в эмпирических обоснованиях (там есть графики) совсем мало "слов" (от 3 до 6 в зависимости от числа символов в алфавите). Автор считает это аналогом закона Ципфа в естественных языках и заключает из этого, что в естественных языках нет необходимости искать что-то мистическое в этом законе. Интуитивно для меня это выглядит скорее правдоподобным, чем бредом, хотя не уверен, что я достаточно глубоко понимаю взаимосвязи.

 Профиль  
                  
 
 Re: Закон Ципфа - верен для для любых текстов или осмысленных?
Сообщение03.09.2015, 12:24 
Аватара пользователя


21/09/12

1871
Цитата:
- Не понимаю, почему люди так восхищаются этим Карузо? Косноязычен, гугнив, поёт - ничего не разберёшь!
- А вы слышали, как поёт Карузо?
- Да, мне тут кое-что из его репертуара Рабинович напел по телефону.

Я к чему?
Американский биолог, вероятно, прав. Но объяснение его идеи в статье Википедии действительно "бредовое".
В английском ноль - и не я один. Потому буду благодарен за правильное разъяснение статьи Вэньтянь Ли в русскоязычной Википедии.

 Профиль  
                  
 
 Re: Закон Ципфа - верен для для любых текстов или осмысленных?
Сообщение03.09.2015, 13:05 
Заслуженный участник
Аватара пользователя


09/09/14
6328

(Оффтоп)

atlakatl
Надеюсь, мы пришли к взаимопониманию. В результате (после обсуждения) Ваша последняя постановка вопроса выглядит понятной и приемлемой (для меня, в частности). Надеюсь, что я смогу разобраться глубже в статье (я пока только просмотрел её по диагонали) и внести правки в Вики. Я дам знать тогда.

Мне жаль, что я был излишне эмоционален в этом обсуждении (не только с Вами).

 Профиль  
                  
 
 Re: Закон Ципфа - верен для для любых текстов или осмысленных?
Сообщение04.09.2015, 15:01 
Заслуженный участник
Аватара пользователя


09/09/14
6328
atlakatl
У меня к Вам вопрос по Вашему пониманию формулировок в Вики. Просьба объяснить, как Вы понимаете следующие термины из статистики:
    порядковая шкала (синоним -- ранговая шкала, англ. -- ordinal scale);
    порядковый номер (ранг в порядковой шкале).
Всё же я считаю, что при правильном понимании этих терминов формулировки в обсуждаемой Вики-статье должны и Вам быть интуитивно понятными. В любом случае я не вижу, каким образом нужно исправлять правильные формулировки на более понятные, если не повторять в этом же (обсуждаемом) абзаце из Вики полностью формулировку закона Ципфа, которая дана в начале статьи и уже к этой формулировке давать ненужные, на мой взгляд, пояснения.

 Профиль  
                  
 
 Re: Закон Ципфа - верен для для любых текстов или осмысленных?
Сообщение04.09.2015, 15:38 
Аватара пользователя


21/09/12

1871
Порядковая шкала - нумерованный список, сортирующий массив данных по какому-либо критерию.
Порядковый номер - номер в этом списке.
grizzly, это же Ваша формулировка в Википедии?
Цитата:
В общих чертах доказательство этой теории состоит в следующем. Вероятность случайного появления какого-либо слова длиной n в цепочке случайных символов уменьшается с ростом n в той же пропорции, в какой растёт при этом номер этого слова в частотном списке. Потому произведение номера слова на его частоту есть константа.

Суть понятна. Интересно будет пробить этот тезис с математической точки зрения.

 Профиль  
                  
 
 Re: Закон Ципфа - верен для для любых текстов или осмысленных?
Сообщение04.09.2015, 15:59 
Заслуженный участник
Аватара пользователя


09/09/14
6328
Понимание порядковой шкалы и ранга у Вас не совсем верные. Они применимы только в некоторых частных случаях. Можете посмотреть самостоятельно в сети? Или поднимите вопрос в ПРР -- пусть лучше Вам объяснят профессионалы в статистике.
На этом, я думаю, мы закончим с первым из обсуждаемых абзацев. Переходим ко второму.

atlakatl в сообщении #1050431 писал(а):
grizzly, это же Ваша формулировка в Википедии?
...

Нет, формулировка не моя. Откуда такая гипотеза :?: Я предлагаю подкорректировать формулировку следующим образом:
Цитата:
В общих чертах доказательство этой теории состоит в следующем. Вероятность случайного появления какого-либо слова длиной n в цепочке случайных символов уменьшается с ростом $n$ в той же пропорции, в какой растёт при этом порядковый номер (ранг) этого слова в частотном списке (порядковой шкале). Потому произведение порядкового номера слова на его частоту есть константа.

В такой формулировке будет видно, что используются термины статистики, а не привычные на бытовом уровне слова.

 Профиль  
                  
 
 Re: Закон Ципфа - верен для для любых текстов или осмысленных?
Сообщение04.09.2015, 16:14 
Заслуженный участник


20/08/14
11769
Россия, Москва
grizzly в сообщении #1050442 писал(а):
В такой формулировке будет видно, что используются термины статистики, а не привычные на бытовом уровне слова.
Сомневаюсь. Слова в скобках обычно носят уточняющий смысл и могут быть опущены без кардинального изменения смысла выражения. Т.е. ссылка на статистику слишком неявная и непрофессионалы (как я) на неё просто не обратят внимания, imho.
Как вариант решения я бы предложил разбить абзац на два: сначала для бытового понимания, потом, после слов типа "Более строго:" - пояснение что термины (и какие именно) используются из статистики.

 Профиль  
                  
 
 Re: Закон Ципфа - верен для для любых текстов или осмысленных?
Сообщение04.09.2015, 16:23 
Аватара пользователя


21/09/12

1871
grizzly в сообщении #1050442 писал(а):
Откуда такая гипотеза :?:

Последняя правка статьи была уже в сентябре... Сейчас посмотрел историю: этот абзац недавно не правился. Извиняюсь.
Ваша формулировка действительно более математична. Если Вы уверены в синонимичности терминов "порядковый номер - ранг" и "частотный список - порядковая шкала", то можно и заменить формулировку на Вашу.

 Профиль  
                  
 
 Re: Закон Ципфа - верен для для любых текстов или осмысленных?
Сообщение04.09.2015, 16:32 
Заслуженный участник
Аватара пользователя


09/09/14
6328
Dmitriy40 в сообщении #1050448 писал(а):
Слова в скобках обычно носят уточняющий смысл и могут быть опущены без кардинального изменения смысла выражения. Т.е. ссылка на статистику слишком неявная

Мне казалось, что утверждение без слов в скобках тоже верное -- главное, нужно было заменить бытовое "номер" на статистическое "порядковый номер".
Но я согласен, что это продолжает сбивать с толку. Лучше просто сказать:
"в какой растёт при этом ранг этого слова в частотном списке (порядковой шкале)".

atlakatl в сообщении #1050452 писал(а):
Если Вы уверены в синонимичности терминов "порядковый номер - ранг" и "частотный список - порядковая шкала", то можно и заменить формулировку на Вашу.

Да, меня уже убедили, что лучше без "порядкового номера". В синонимичности "частотного списка -- порядковой шкалы" в данном контексте я действительно уверен, но в моей формулировке я на ней и не настаиваю -- оставшиеся скобки даны только для уточнения, поскольку всё рассуждение идёт "на пальцах".

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 28 ]  На страницу Пред.  1, 2

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group