2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу Пред.  1, 2
 
 Re: Закон Ципфа
Сообщение01.11.2011, 22:17 
synphara в сообщении #493236 писал(а):
Дня два потерял пытаясь понять почему у Ципфа квадрат, а у всех вокруг квадрата нет. Интегральныфй и дифференциальный законы распределения здесь ни при чём.

Ни черта Вы не поняли, видимо двух дней оказалось мало... :-(

 
 
 
 Re: Закон Ципфа
Сообщение01.11.2011, 22:46 
Аватара пользователя
Так в чём дело-то?

 
 
 
 Re: Закон Ципфа
Сообщение01.11.2011, 22:51 
Аватара пользователя

(Оффтоп)

2w_ink в сообщении #320914 писал(а):
Историческое отступление, в древнерусском языке, животное именовалось
- 'рыктос', но с ходом истории, ростом хозяйственной деятельности русского человека и приближения его к современной орудийной оснащенности, животное стало одним из ресурсов выживания. Вот и произошла смена нарратива на 'медведь', а наименование 'рыктос' фактически утеряно при переходе с древнерусского к современному русскому языку.

Существует даже мнение, что "рыктос" - тоже эвфемизм (рычащий зверь), а медведя звали как-то вроде "рысь" (ср. с "урсус"), и это слово не исчезло.

 
 
 
 Re: Закон Ципфа
Сообщение01.11.2011, 23:20 
synphara в сообщении #498348 писал(а):
Так в чём дело-то?

Я все объяснил, см. выше

 
 
 
 Re: Закон Ципфа
Сообщение03.11.2011, 12:37 
Аватара пользователя
druggist писал(а):
Я все объяснил, см. выше
Интегральный закон распределения описывает вероятность того что выпадающее значение случайной величины не превысит некоторый порог. Этому смыслу не соответствует ни ранг-частотному распределение ни зависимость количества слов от количества их повторения в тексте. Эти законы оба дифференциальные.

 
 
 
 Re: Закон Ципфа
Сообщение04.11.2011, 01:16 
synphara в сообщении #498785 писал(а):
распределения описывает вероятность того что выпадающее значение случайной величины не превысит некоторый порог.

Уже неплохо. Теперь подумайте, что из себя будет представлять интегральный спектр, ну например, число городов с населением больше данного или число слов с частотой встречаемости больше некоторой и как это распределение соотносится с ранговым, а также с дифференциальным, т.е., с плотностью вероятности или же вероятностью городу иметь население m человек, или слову иметь частоту встречаемости в тексте m раз...

 
 
 
 Re: Закон Ципфа
Сообщение04.11.2011, 10:54 
Circiter в сообщении #320905 писал(а):
Прямая ссылка на ранее упомянутую вэнтянявскую заметку, может кому интересно будет...

Дело в том, что степенные распределения, негауссовы "толстые" хвосты(fat tails) очень часто возникают как совокупление двух экспонент. Обе зависят от параметра, одна как правило растущая, другая падающая. Поясню на примере обезьяны, печатающей на машинке ципфоподобные тексты. Есть алфавит, содержащий допустим 20 букв плюс пробел, т.е., общее кол-во знаков, которые с равной вероятностью набираются обезьяной, равно 21. Вероятность нахождения в таком тексте слова длины L(любая последовательность L букв между двумя последовательными пробелами) обратно пропорциональна е в степени пропорциональной L (падающая экспонента), а число различных последовательностей букв длины L (различных слов длины L) наоборот пропорционально е в степени L c некоторым коэффициентом(растущая экспонента). Избавляясь от параметра L, получаем степенное распределение

 
 
 
 Re: Закон Ципфа
Сообщение05.11.2011, 21:37 
Аватара пользователя
druggist писал(а):
Теперь подумайте, что из себя будет представлять интегральный спектр


Что вы понимаете под интегральным спектром? В сети нашёл только узкоспециальные понятия вроде "интегрального спектра излучения лавинного ГР", "Интегральный спектр всех частиц" либо что-то плотно завязанное на Фурье.

druggist писал(а):
число городов с населением больше данного или число слов с частотой встречаемости больше некоторой и как это распределение соотносится с ранговым, а также с дифференциальным


Возможно вы намекаете на то что проинтегрировав второй закон Ципфа можно получить первый. Но во-первых в этом случае вы просто получаете интегральное распределение второго закона Ципфа, а не первый закон - первый закон вроде не никак связан с формулировками типа "число городов с населением больше данного". Во-вторых при интегрировании появляется отрицательный коэффициент, который меняет форму распределения.

 
 
 
 Re: Закон Ципфа
Сообщение06.11.2011, 00:44 
synphara в сообщении #499889 писал(а):
первый закон - первый закон вроде не никак связан с формулировками типа "число городов с населением больше данного"

А если подумать? Что такое первый закон? Зависимость размер - ранг. Разберем на примере численности населения городов. Выстраиваем столбики высотой А (население города) в порядке убывания, т.о., самый большой город(самый высокий столбик) имеет ранг еденицу, следующий по численности двойку и т.д. Пусть город с населением А имеет ранг N, тогда N(А) будет как раз равно числу городов с населением больше данного просто по принципу "рангового" построения

 
 
 
 Re: Закон Ципфа
Сообщение22.05.2015, 17:10 
Аватара пользователя
Яблонский, а затем Хайтун полагали распределение Ципфа наряду с распределением Гаусса предельными видами распределений. Гаусса для явлений физического мира, Ципфа для социального. Относительно распределения слов в языке. Распределение Ципфа применительно к распределению слов несколько раз уточнялось - в нем сначала Мандельброт подкорректировал частоты первых слов, затем были подкорректированы частоты хвоста, и наконец описан специфичный провал в области слов со средними частотами. Т.ч. подобное распределение сейчас характеризуется уже не одним параметром, как у Ципфа, а пятком, точного числа не помню. Но кажется все они имеют некий лингвистический смысл, это не голимая аппроксимация.

 
 
 [ Сообщений: 25 ]  На страницу Пред.  1, 2


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group