2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Из ПУШКИ НА...
Сообщение29.05.2006, 14:28 
Заморожен


08/11/05
499
Москва Первомайская
Мне под своими сообщениями хотелось бы иметь подпись со следующими свойствами:

1. В ней должны встречаться все 33 буквы современной русской азбуки;

2. Отношение числа гласных к числу должно составлять в точности 3 к 4 или, по крайней мере, 0.43 к 0.57 (будем считать Й гласной, а Ъ и Ь согласными);

3. Она должна быть осмысленной, желательно цитатой из русской или советской классики, а еще лучше - из Пушкина, и по возможности покороче.

Более того, есть идея обобщить эту подпись до возможного послания потомкам или иным цивилизациям. Требования те же, но потребуем еще, чтобы сохранялись и другие свойства русского текста, например

4. Должны соблюдаться современные частоты встречаемости отдельных букв, пар букв и т.д.

Заметьте: когда шифруют текст, то обычно стремятся сгладить или деформировать естественную встречаемость его букв, мы же, наоборот, постараемся сохранить их статистику, отражающую тот мир, в котором мы живем, поскольку именно о ней, об этой статистике, и будет наше Русское послание.

Что скажете?

 Профиль  
                  
 
 
Сообщение29.05.2006, 14:31 
Заморожен


08/11/05
499
Москва Первомайская
Вот, например, из пушкинской Сказки о рыбаке и рыбке.

Ничего не сказала рыбка,
Лишь хвостом по воде плеснула
И ушла в глубокое море.

Здесь 63 буквы, 27 гласных и 36 согласных, в точности 3 к 4, но не используется целых 10 букв: ё, ж, й, ф, ц, щ, ъ, э, ю, я.

А вот про Татьяну Ларину из "Евгения Онегина", 3XXIV.

Она по-русски плохо знала,
Журналов наших не читала
И выражалася с трудом
На языке своём родном,
Итак, писала по-французски...

С многоточием, как у Пушкина. Здесь ровно 100 букв, 43 гл. и 57 согл., но не используются буквы б, г, й, щ, ъ, ь, э, ю.

Естественный текст, использующий все буквы азбуки, в среднем наверняка будет длиннее...

 Профиль  
                  
 
 
Сообщение29.05.2006, 15:55 
Экс-модератор
Аватара пользователя


23/12/05
12064
Не удовлетворяет Вашим требованиям, но вспомнил коротенькую фразу, в которой не хватает только двух букв русского алфавита: ъ, ё:

Жил-был цитрус в чащах юга? Да, но фальшивый экземпляр.

 Профиль  
                  
 
 
Сообщение29.05.2006, 16:37 
Основатель
Аватара пользователя


11/05/05
4312
http://cepesh.mexmat.ru/scripts/lexic_calc.php
может быть полезным при подсчетах :)

 Профиль  
                  
 
 
Сообщение29.05.2006, 17:38 
Заморожен


08/11/05
499
Москва Первомайская
Большое спасибо за калькулятор. Отличная вещь!

 Профиль  
                  
 
 
Сообщение29.05.2006, 17:43 
Основатель
Аватара пользователя


11/05/05
4312
бобыль писал(а):
Большое спасибо за калькулятор. Отличная вещь!

Пожалуйста. Могу доработать с учетом Ваших пожеланий. :)

 Профиль  
                  
 
 
Сообщение30.05.2006, 17:27 
Заморожен


08/11/05
499
Москва Первомайская
Очень хороший калькулятор получился. Только мне бы лично хотелось, чтобы Й была гласной, а не согласной буквой. И еще почему-то буква Ё оказывается первой по алфавиту, если ввести текст, лишь из этого алфавита и состоящий; в этом случае алфавитный порядок в правом столбце тоже не сохраняется, не знаю, правда, нужно ли его сохранять.

 Профиль  
                  
 
 
Сообщение30.05.2006, 17:49 
Основатель
Аватара пользователя


11/05/05
4312
судьба у буквы ё тяжелая, как-нить на досуге сделаю ей нормальное место :) а справа отсортировано по частоте.
Нас в школе учили, что й -- согласная буква, а Ъ и Ь не являются ни гласными, ни согласными...

 Профиль  
                  
 
 
Сообщение30.05.2006, 18:15 
Заморожен


08/11/05
499
Москва Первомайская
cepesh писал(а):
а справа отсортировано по частоте


Правильно, по частоте. Но если частоты одинаковые, то порядок букв случайный? Пусть будет случайный, я не возражаю.

Цитата:
Нас в школе учили, что й -- согласная буква, а Ъ и Ь не являются ни гласными, ни согласными...


Я в общем не настаиваю. Только тогда много красивее получается: 11 гласных и 22 согласных (т.е. 1 к 2), и в тексте их отношение в среднем не 0.72, а 0.75 (т.е. 3 к 4).

 Профиль  
                  
 
 
Сообщение31.05.2006, 16:50 
Заморожен


08/11/05
499
Москва Первомайская
До сих пор буквы, гласные и согласные, понимались нами буквально. Сделаем теперь следующий шаг. Будем понимать под "буквами" не буквы, а целые слова (в т.ч. сокращенные).

Возьмем для примера знаменитую анонимку, связанную с гибелью А. Пушкина. Казалось бы, этот артефакт XIX века давно изучен вдоль и поперек. Что здесь можно сказать нового?! Но оказывается, что можно. Вот перевод этого пасквиля с фр., взятый из книжки Н.Я. Петракова, пушкиниста-любителя, а вообще-то академика-экономиста; как говорится: что написано пером, не вырубишь топором.

"Полные Кавалеры, Командоры и кавалеры Светлейшего Ордена Всех Рогоносцев, собравшихся в Великом Капитуле под председательством достопочтенного Великого Магистра Ордена Его Превосходительства Д.Л. Нарышкина, единодушно избрали г-на Александра Пушкина коадъютором Великого Магистра Ордена Всех Рогоносцев и историографом Ордена. Непременный секретарь граф И. Борх."

В буквальном смысле здесь 312 букв, 131 гласная и 181 согласная (при отсутствующих Ё, Ж, Щ, Э и с оговоркой про Й, Ъ и Ь). Перепишем этот текст следующим образом:

полные непременный всех всех единодушно, великом великого великого, светлейшего достопочтенного, его, превосходительства председательством, г-на, под, и и, в, КАПИТУЛЕ, ОРДЕНА ОРДЕНА ОРДЕНА ОРДЕНА, РОГОНОСЦЕВ РОГОНОСЦЕВ, КАВАЛЕРЫ КАВАЛЕРЫ, КОМАНДОРЫ, МАГИСТРА МАГИСТРА, Д.Л., НАРЫШКИНА, АЛЕКСАНДРА, ПУШКИНА, КОАДЪЮТОРОМ, ИСТОРИОГРАФОМ, СОБРАВШИХСЯ, ИЗБРАЛИ, СЕКРЕТАРЬ, ГРАФ, И., БОРХ.

Здесь "гласными" и "согласными" считаем строчные и прописные слова, 9 и 18 штук (т.е. 1 к 2), употребленные 18 раз и 24 раза (т.е. 3 к 4), курсив же изображает варианты и повторы их написания. Очень неплохо. Обратите также внимание, как распределились здесь части речи. А что совсем неожиданно - строчных и прописных букв здесь тоже 131 и 181, т.е. столько же, сколько гласных и согласных в буквальном смысле! Как вы думаете, о чем это говорит?

http://www.geomath.newmail.ru/sgustok/serves/anonyme.htm

 Профиль  
                  
 
 
Сообщение04.06.2006, 17:25 
Основатель
Аватара пользователя


11/05/05
4312
В тему:
http://en.wikipedia.org/wiki/Pangram

 Профиль  
                  
 
 
Сообщение05.06.2006, 15:14 
Заморожен


08/11/05
499
Москва Первомайская
cepesh писал(а):


Да, очень уместная ссылка, особенно про панграммы, перечисляющие сами себя. И она вроде бы не обесценивает нашу задачу про "3 к 4" и другие частоты и вообще про послание...

Вот заодно я поискал "панграммы" Гуглем:

http://www.google.ru/search?hl=ru&ie=windows-1251&q=%EF%E0%ED%E3%F0%E0%EC%EC%FB&lr=.

 Профиль  
                  
 
 
Сообщение05.06.2006, 16:12 
Заморожен


08/11/05
499
Москва Первомайская
Я, возможно, плохо искал, но я не нашел русского аналога следующей панграммы.

Цитата:
This Pangram contains four a's, one b, two c's, one d, thirty e's, six f's, five g's, seven h's, eleven i's, one j, one k, two l's, two m's, eighteen n's, fifteen o's, two p's, one q, five r's, twenty-seven s's, eighteen t's, two u's, seven v's, eight w's, two x's, three y's, & one z.

 Профиль  
                  
 
 
Сообщение07.06.2006, 13:55 
Заморожен


08/11/05
499
Москва Первомайская
В справочнике для учителей написано, что из 5000 морфем русского языка (отмеченных в Словаре...) более 4400 морфем - это корни, а около 600 - аффиксы. В то же время сказано, что в нашей речи, особенно в разговорной, корневые морфемы встречаются реже аффиксальных; так, в отрывке "Зима недаром злится, Прошла ее пора" 6 корней и 10 аффиксов. Но во сколько раз реже и насколько этот отрывок представителен, ПОЧЕМУ-ТО не сказано. Как вы считаете, почему?

 Профиль  
                  
 
 
Сообщение23.11.2006, 14:48 
Аватара пользователя


15/11/06
2689
Москва Первомайская
Уважаемый cepesh! Нельзя ли добавить в Ваш замечательный калькулятор еще и вычисление энтропии введенного текста? По формуле

$H = -p_1\log_2 p_1 - ... - p_{33}\log_2 p_{33}.$

И все это желательно поделить еще на $\sqrt 2$, тогда получится $\pi$ с некоторой точностью. Вместо двоичного логарифма можно взять натуральный, деленный на натуральный логарифм двух, а если какая-то частота равна 0, то член с ней тоже равен нулю. Зачем это нужно, см.

http://dxdy.ru/viewtopic.php?p=41524#41524.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 23 ]  На страницу 1, 2  След.

Модераторы: Модераторы, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: CDDDS


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group