2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4, 5, 6, 7, 8 ... 10  След.
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение22.07.2014, 20:45 
Заслуженный участник
Аватара пользователя


09/05/13
7819
Shtorm, да бог с ней, с технологией, это на первом курсе рассказывают, Вы в связи с Вашей темой в главном определитесь: таки точки локального максимума или наибольшие значения функции?
Ну это же, прямо так скажем, две большие разницы.

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение22.07.2014, 21:22 
Аватара пользователя


14/02/10
4956
Otta в сообщении #889499 писал(а):
А ничего, что это не выборка?


Otta, да я неудачно там всё написал с вариационным рядом. Ниже ещё напишу другой, правильный.
Otta в сообщении #889499 писал(а):
Для студентов вполне достаточно знать определение моды в том виде, в каком оно содержится в основных источниках (то есть именно точка максимума распределения - того или этого

Уточню, сейчас мы говорим о моде именно СВ, а не вариационного ряда. И методичку я пишу только по СВ, не касаясь математической статистики. Математическую статистику мы в этой теме затрагиваем только как наглядное обоснование - откуда чего пошло в теории вероятностей.
Итак, Вы говорите об основных источниках? Можете назвать, какие источники Вы называте основными? Я например, пользовался:
Вентцель Е.С. Теория вероятностей.
Вентцель Е.С., Овчаров Л.А. Теория вероятностей и её инженерные приложения.
Чернова Н.И. Теория вероятностей. Учебное пособие. Новосибирск 2009.
Кремер Н.Ш. Теория вероятностей и математическая статистика.
Письменный Д.Е. Конспект лекций по теории вероятностей, математической статистике и случайным процессам.
и др.

Во всех вышеперечисленных книгах написано, что мода ДСВ - это не просто значение $x$, где веротятность максимальная. А именно максимальна по сравнению с соседними значениями. В Вентцель только сначала написано, что максимальное значение, но тут же даётся понятие полимодальности и из рисунков видно, что имеется ввиду именно локальный максимум. (это добавил позднее) Мода НСВ - не просто точка максимума, а точка локального максимума. Соответственно у СВ могут быть как унимодальные, так и полимодальные распределения.

Otta в сообщении #889499 писал(а):
Если пытаться это все формализовать до полного безобразия, понимания не прибавится, а только убавится, - опять же имхо.


Ну какое тут безобразие? Нормальное определение. Просто остаются вопросы, которые низбежно возникнут при практическом нахождении моды различных произвольных СВ. И возможно, определение следует слегка уточнить для полной ясности. А по-Вашему выходит - стремление к истине, ведёт во мрак незнания? Парадокс же! :D И правильно, что Вы дальше приводите пример:

Otta в сообщении #889499 писал(а):
Вот выборка

$x \ \ \ 1 \ \ \ \ 2 \ \ \ \ 3 \ \ \ \ 4 \ \ \ \ 5$

$n \ \ \ 7 \ \ \ \ 6\ \ \ \ 7 \ \ \ \ 6 \ \ \ \ 7 $

- она как по-Вашему, сколько мод имеет? Или может, ее лучше считать за выборку из равномерного распределения?


Согласно определению, данному в начале темы, распределение имеет три моды: $x_1=1, x_3=3, x_5=5$

А вот если бы все частоты были равны $7$ - вот тогда было бы дискретное равномерное распределение и моды бы не было вообще.

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение22.07.2014, 21:24 
Заслуженный участник
Аватара пользователя


27/04/09
27139
Shtorm в сообщении #889508 писал(а):
Таким образом, можно так сформулировать поиск моды для НСВ:
1. Находим область определения функции плотности, точки разрыва.
2. Исследуем характер точек разрыва.
3. На каждом интервале непрерывности находим нестрогие локальные максимумы.
4. На каждом интервале непрерывности находим наибольшее значение функции плотности.
5. Все точки нестрогого локального максимума и наибольшие значения функции на интервалах непрерывности будут являться значениями мод.
Всё верно?
Ничего не верно. Рефакторингом отсюда выделяется это длинное не нужное здесь, как уже несколько раз повторялось, повторение.

(Оффтоп)

Вершинами треугольника $ABC$ назовём точки $A,B,C$.
Вершинами четырёхугольника $ABCD$ назовём точки $A,B,C,D$.
Вершинами пятиугольника $ABCDE$ назовём точки $A,B,C,D,E$.
Вершинами шестиугольника $ABCDEF$ назовём точки $A,B,C,D,E,F$.

Вершинами двадцатипятиугольника $AB\ldots Y$ назовём точки $A,B,\ldots,Y$.
Вершинами двадцатишестиугольника $AB\ldots YZ$ назовём точки $A,B,\ldots,Y,Z$.
Вершинами двадцатисемиугольника $AB\ldots YZ$Internal error 0x8c.

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение22.07.2014, 21:32 
Аватара пользователя


14/02/10
4956
Otta в сообщении #889518 писал(а):
Вы в связи с Вашей темой в главном определитесь: таки точки локального максимума или наибольшие значения функции?
Ну это же, прямо так скажем, две большие разницы.

:-)

Я должен своё определение изобретать или всё же воспользоваться вышеперечисленными уважаемыми книгами? В тех книгах чёрным по белому написано: локальный максимум. :-) И в ряде случаев наибольшее значение функции совпадает со значением локального максимума. Примеры: показательное (экспоненциальное распределение) и нормальное распределение. А почему я в вышенаписанной "технологии" объединил наибольшее значение и локальный максимум - потому что есть такое арксинус-распределение, у которого в точках разрыва второго рода пишут значение двух мод. Там же не локальный максимум?

-- Вт июл 22, 2014 21:33:35 --

arseniiv, хорошо, как будет правильно?

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение22.07.2014, 21:40 
Заслуженный участник


11/11/07
1198
Москва
Shtorm в сообщении #889524 писал(а):
И в ряде случаев наибольшее значение функции совпадает со значением локального максимума.

О боже... наибольшее значение всегда совпадает с каким-нибудь локальным максимумом.

1. Найти точки разрыва.
2. На каждом интервале непрерывности найти стационарные точки (производная равна нулю или имеет разрыв).
3. Из полученных точек выделить, где будет (локальный, если так нравится) максимум.
4. Сделать с этими точками (локального) максимума что-нибудь нехорошее.
В общем как-то так.

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение22.07.2014, 21:42 
Заслуженный участник
Аватара пользователя


27/04/09
27139
Shtorm в сообщении #889524 писал(а):
arseniiv, хорошо, как будет правильно?
Не меня спрашивайте. Тут уже дан алгоритм ваших действий:
1. Определяетесь, локальный ли мода максимум или глобальный.
2.

:roll:

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение22.07.2014, 21:56 
Аватара пользователя


14/02/10
4956
AV_77 в сообщении #889525 писал(а):
О боже... наибольшее значение всегда совпадает с каким-нибудь локальным максимумом.

:-) Я имел ввиду наибольшее значение функции на отрезке. А они, как известно, не всегда совпадают.

AV_77 в сообщении #889525 писал(а):
1. Найти точки разрыва.
2. На каждом интервале непрерывности найти стационарные точки (производная равна нулю или имеет разрыв).
3. Из полученных точек выделить, где будет (локальный, если так нравится) максимум.
4. Сделать с этими точками (локального) максимума что-нибудь нехорошее.
В общем как-то так.


Спасибо за алгоритм. Искренне уважаю людей, которые реально пытаются помочь.

Касательно стационарной точки: у меня в голове сидит информация, что стационарной называется только та точка, в которой производная равна нулю. Точки в которых производная либо равна нулю, либо не существует называется критической. Я не прав?
Далее, Ваш второй пункт предполагает нахождение производной, а затем приравнивание её к нулю и нахождение точек, где производная не существует. Действуя именно таким образом мы, например, не сможем отыскать моду показательного распределения. Именно поэтому, я в свой алгоритм добавил поиск наибольшего значения функции на интервале непрерывности.

-- Вт июл 22, 2014 22:11:04 --

arseniiv в сообщении #889528 писал(а):
Определяетесь, локальный ли мода максимум или глобальный.


Согласно уважаемым книгам, глобальный максимум функции плотности - это наивероятнейшее значение случайной величины и она тоже является модой или одной из мод.
Да. Пардон. В Вентцель и Кремере написано сначала, что мода - это просто, где достигается максимальное значение. Но тут же приводятся рисунки с полимодальным распределением, откуда видно, что имеется ввиду именно локальный максимум. (добавил эту фразу в моё сообщение выше) А вот во всех остальных книгах, которые я там выше написал - сразу в определении пишется слово локальный, чтобы ни у кого сомнений не оставалось.

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение23.07.2014, 00:42 
Аватара пользователя


21/01/09
3430
Дивногорск
Вот два дискретных распределения (пишу только вероятности):

$0.35; 0.35; 0.2; 0.1$

$0.2; 0.3; 0.3; 0.2$

Сколько у них мод?

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение23.07.2014, 00:58 
Аватара пользователя


14/02/10
4956
Александрович, отличный вопрос! :-) Я сам подобный хотел задать после того как утихнут страсти вокруг экстремумов функции плотности.
Согласно тому определению, в первом распределении моды вообще не будет. Но это неправильно! Надеюсь все согласны, что это неправильно? Поэтому определение надо просто немного подкорректировать, чтобы чётко из определения следовало, что мода будет соответствовать вероятностям $0.35$. То есть будет две моды.
Во-втором распределении всё тоже самое, корректируем определение, получаем две моды, соответствующие веротяности $0.3$
Александрович, ответьте пожалуйста на вопросы Henrylee

Henrylee в сообщении #889489 писал(а):
Александрович в сообщении #889384 писал(а):
Смесь где? Смесь в принципе может быть составлена и из дискретных СВ.


Мне это известно. И при чем тут моды?

Александрович в сообщении #889472 писал(а):
Да, смесь распределений может имеет полимодальный вид.


Как и унимодальный. И что из этого. Как непосредственно понятие смеси связано с количеством мод?


Мне кажется это очень важный вопрос и возможно Ваш ответ на него расставит все точки над "и" в теме!

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение23.07.2014, 02:27 
Аватара пользователя


21/01/09
3430
Дивногорск
К конструкциям показанных на примерах могут привести распределения Пуассона и биномиальное. Они точно унимодальные, поэтому стоит признать что модой можно назвать и две рядом стоящие СВ. Мультимодальность может возникнуть только в смеси распределений, вот такая связь.

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение23.07.2014, 07:40 


23/05/12

1245
Александрович в сообщении #889578 писал(а):
Мультимодальность может возникнуть только в смеси распределений, вот такая связь.

Это неверно.

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение23.07.2014, 10:54 
Аватара пользователя


21/01/09
3430
Дивногорск
Что именно не верно?

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение23.07.2014, 15:34 
Аватара пользователя


14/02/10
4956
Александрович в сообщении #889578 писал(а):
К конструкциям показанных на примерах могут привести распределения Пуассона и биномиальное. Они точно унимодальные


Открываем книгу Бочаров П.П., Печинкин А.В. "Теория вероятностей. Математическая статитика". Читаем в примере 34:
"...таким образом, если $np-q$ не является целым, то максимальное $i$, для которого $i>np-q$, является модой и наивероятнейшим значением. Если же $np-q$ - целое, то биномиальный закон имеет две моды и два наивероятнейших значения: $np-q$ и $np-q+1$".

Александрович, вот так вот, не "точно унимодальные", а могут быть унимодальными, а могут быть бимодальными. Рассмотрим пример:
Монета подбрасывается 5 раз. Пусть случайная величина $X$ - число выпадений орла. Составить ряд распределения ДСВ, найти моду.
Решение:
$n=5, p=0.5, q=0,5$
$np-q=2$ - целое
То есть должны быть две моды. Получаем ряд распределения:
Изображение

Согласно вышеприведённой формулировке получаем две моды: $x_3=\frac{10}{32}$ и $x_4=\frac{10}{32}$

Александрович, Вам злободневный вопрос: Где здесь смесь? И что конкретно тут смешивается?


Теперь снова открываем книгу Бочаров П.П., Печинкин А.В. "Теория вероятностей. Математическая статитика". Читаем:
"Для определения моды дискретной случайной величины, предположим сначала, что её значения $X_1,...X_n$ расположены в порядке возрастания. Тогда модой дискретной случайной величины называется такое значение $X_i$, что $ p_{i-1}<p_i$ и $p_{i+1}<p_i$"

Смотрим снова на вышеприведённый пример и видим противоречие между определениями. Вывод: необходимо срочно доработать определение.

Попытка доработки:

(удалил) Что-то сходу не получается. Прошу помощи у всех участников форума в доработке определения.

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение23.07.2014, 15:54 
Аватара пользователя


21/01/09
3430
Дивногорск
Shtorm в сообщении #889705 писал(а):
Александрович, Вам злободневный вопрос: Где здесь смесь? И что конкретно тут смешивается?

Когда я говорил о смеси я имел ввиду не подряд идущие моды.
Цитата:
Мода - это такое значение признака, которое встречается наиболее часто. В случае дискретных рядов вычислить моду нетрудно. Достаточно найти варианту, которая имеет наибольшую частоту или относительную частоту, это и будет мода. Будем обозначать моду символом Мо.

Если все значения в вариационном ряде встречаются одинаково часто, то считают, что этот ряд не имеет моды.

Если два соседних значения вариационного ряда имеют одинаковую частоту и она больше частоты любого другого значения, то считают, что мода равняется среднему арифметическому этих значений.

Если два не соседних значения вариационного ряда имеют одинаковую частоту и она больше частоты любого другого значения, то считают, что вариационный ряд имеет две моды, а соответствующее распределение называют бимодальным.


-- Ср июл 23, 2014 21:10:30 --

Shtorm в сообщении #889571 писал(а):
Согласно тому определению, в первом распределении моды вообще не будет. Но это неправильно! Надеюсь все согласны, что это неправильно? Поэтому определение надо просто немного подкорректировать, чтобы чётко из определения следовало, что мода будет соответствовать вероятностям $0.35$. То есть будет две моды.
Во-втором распределении всё тоже самое, корректируем определение, получаем две моды, соответствующие веротяности $0.3$

Цитата:
РАСПРЕДЕЛЕНИЕ БИМОДАЛЬНОЕ, син. двугорбое распределение (BIMODAL DISTRIBUTION) — распределение с двумя областями высокой частоты, которые разделены областью низкой частоты наблюдений.

Где у вас разделение областью низкой частоты наблюдений?

 Профиль  
                  
 
 Re: Вопросы о моде и медиане случайных величин
Сообщение23.07.2014, 17:12 
Аватара пользователя


14/02/10
4956
Александрович,

1. Откуда взяты эти цитаты, можно ссылочку?
2. Мы в теме говорим именно о ряде распределения в ТВ. У Вас в ссылках речь идёт о вариационном ряде в МС. Хотя мы и говорим о похожести, наверное стоит всё же подумать, что в определении моды могут быть отличия.
3. Я Вам процитировал учебник по ТВ, согласно которому в биномиальном распределении идут две моды подряд, при определённых условиях. Никакой области с низкой частотой вероятностью между ними быть не может в биномиальном ряду. И усреднять их не нужно.
4. Если такая ситуация неблюдается для биномиального распределения, то почему такой ситуации не может быть для других распределений ДСВ. В частности, тех которые Вы мне выше привели в пример с соседними модами.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 138 ]  На страницу Пред.  1, 2, 3, 4, 5, 6, 7, 8 ... 10  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group