2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу Пред.  1, 2
 
 Re: Закон Ципфа
Сообщение01.11.2011, 22:17 


27/02/09
2840
synphara в сообщении #493236 писал(а):
Дня два потерял пытаясь понять почему у Ципфа квадрат, а у всех вокруг квадрата нет. Интегральныфй и дифференциальный законы распределения здесь ни при чём.

Ни черта Вы не поняли, видимо двух дней оказалось мало... :-(

 Профиль  
                  
 
 Re: Закон Ципфа
Сообщение01.11.2011, 22:46 
Аватара пользователя


16/10/11
124
Так в чём дело-то?

 Профиль  
                  
 
 Re: Закон Ципфа
Сообщение01.11.2011, 22:51 
Заслуженный участник
Аватара пользователя


14/02/07
2648

(Оффтоп)

2w_ink в сообщении #320914 писал(а):
Историческое отступление, в древнерусском языке, животное именовалось
- 'рыктос', но с ходом истории, ростом хозяйственной деятельности русского человека и приближения его к современной орудийной оснащенности, животное стало одним из ресурсов выживания. Вот и произошла смена нарратива на 'медведь', а наименование 'рыктос' фактически утеряно при переходе с древнерусского к современному русскому языку.

Существует даже мнение, что "рыктос" - тоже эвфемизм (рычащий зверь), а медведя звали как-то вроде "рысь" (ср. с "урсус"), и это слово не исчезло.

 Профиль  
                  
 
 Re: Закон Ципфа
Сообщение01.11.2011, 23:20 


27/02/09
2840
synphara в сообщении #498348 писал(а):
Так в чём дело-то?

Я все объяснил, см. выше

 Профиль  
                  
 
 Re: Закон Ципфа
Сообщение03.11.2011, 12:37 
Аватара пользователя


16/10/11
124
druggist писал(а):
Я все объяснил, см. выше
Интегральный закон распределения описывает вероятность того что выпадающее значение случайной величины не превысит некоторый порог. Этому смыслу не соответствует ни ранг-частотному распределение ни зависимость количества слов от количества их повторения в тексте. Эти законы оба дифференциальные.

 Профиль  
                  
 
 Re: Закон Ципфа
Сообщение04.11.2011, 01:16 


27/02/09
2840
synphara в сообщении #498785 писал(а):
распределения описывает вероятность того что выпадающее значение случайной величины не превысит некоторый порог.

Уже неплохо. Теперь подумайте, что из себя будет представлять интегральный спектр, ну например, число городов с населением больше данного или число слов с частотой встречаемости больше некоторой и как это распределение соотносится с ранговым, а также с дифференциальным, т.е., с плотностью вероятности или же вероятностью городу иметь население m человек, или слову иметь частоту встречаемости в тексте m раз...

 Профиль  
                  
 
 Re: Закон Ципфа
Сообщение04.11.2011, 10:54 


27/02/09
2840
Circiter в сообщении #320905 писал(а):
Прямая ссылка на ранее упомянутую вэнтянявскую заметку, может кому интересно будет...

Дело в том, что степенные распределения, негауссовы "толстые" хвосты(fat tails) очень часто возникают как совокупление двух экспонент. Обе зависят от параметра, одна как правило растущая, другая падающая. Поясню на примере обезьяны, печатающей на машинке ципфоподобные тексты. Есть алфавит, содержащий допустим 20 букв плюс пробел, т.е., общее кол-во знаков, которые с равной вероятностью набираются обезьяной, равно 21. Вероятность нахождения в таком тексте слова длины L(любая последовательность L букв между двумя последовательными пробелами) обратно пропорциональна е в степени пропорциональной L (падающая экспонента), а число различных последовательностей букв длины L (различных слов длины L) наоборот пропорционально е в степени L c некоторым коэффициентом(растущая экспонента). Избавляясь от параметра L, получаем степенное распределение

 Профиль  
                  
 
 Re: Закон Ципфа
Сообщение05.11.2011, 21:37 
Аватара пользователя


16/10/11
124
druggist писал(а):
Теперь подумайте, что из себя будет представлять интегральный спектр


Что вы понимаете под интегральным спектром? В сети нашёл только узкоспециальные понятия вроде "интегрального спектра излучения лавинного ГР", "Интегральный спектр всех частиц" либо что-то плотно завязанное на Фурье.

druggist писал(а):
число городов с населением больше данного или число слов с частотой встречаемости больше некоторой и как это распределение соотносится с ранговым, а также с дифференциальным


Возможно вы намекаете на то что проинтегрировав второй закон Ципфа можно получить первый. Но во-первых в этом случае вы просто получаете интегральное распределение второго закона Ципфа, а не первый закон - первый закон вроде не никак связан с формулировками типа "число городов с населением больше данного". Во-вторых при интегрировании появляется отрицательный коэффициент, который меняет форму распределения.

 Профиль  
                  
 
 Re: Закон Ципфа
Сообщение06.11.2011, 00:44 


27/02/09
2840
synphara в сообщении #499889 писал(а):
первый закон - первый закон вроде не никак связан с формулировками типа "число городов с населением больше данного"

А если подумать? Что такое первый закон? Зависимость размер - ранг. Разберем на примере численности населения городов. Выстраиваем столбики высотой А (население города) в порядке убывания, т.о., самый большой город(самый высокий столбик) имеет ранг еденицу, следующий по численности двойку и т.д. Пусть город с населением А имеет ранг N, тогда N(А) будет как раз равно числу городов с населением больше данного просто по принципу "рангового" построения

 Профиль  
                  
 
 Re: Закон Ципфа
Сообщение22.05.2015, 17:10 
Аватара пользователя


14/02/12

841
Лорд Амбера
Яблонский, а затем Хайтун полагали распределение Ципфа наряду с распределением Гаусса предельными видами распределений. Гаусса для явлений физического мира, Ципфа для социального. Относительно распределения слов в языке. Распределение Ципфа применительно к распределению слов несколько раз уточнялось - в нем сначала Мандельброт подкорректировал частоты первых слов, затем были подкорректированы частоты хвоста, и наконец описан специфичный провал в области слов со средними частотами. Т.ч. подобное распределение сейчас характеризуется уже не одним параметром, как у Ципфа, а пятком, точного числа не помню. Но кажется все они имеют некий лингвистический смысл, это не голимая аппроксимация.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 25 ]  На страницу Пред.  1, 2

Модераторы: Jnrty, Модераторы, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group