2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Распределение и дисперсия
Сообщение13.02.2011, 20:24 


13/02/11
17
Помогите не математику.

Что дано. Конечное множество событий X, допустим 5. Значения также известны. Известно мат ожидание.

Неизвестно распределение вероятностей. Собственно вопрос, не могу понять, будет ли влиять значение дисперсии на результаты. Допустим при 1 млн. генерации чисел, будет ли разница для разных вероятностей соответствующих событий.

Ведь, насколько я понимаю, при уменьшении величины среднеквадратичного отклонения процесс становится менее случайным. Значит ли это, что становится более вероятным что выборка будет более близка к мат ожиданию, чем при распределении с большей дисперсией?

Или я совсем во всем не прав?


Всем заранее спасибо!

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение13.02.2011, 21:22 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Ничо не понятно.

Ну, начнем с того, что судя по словам "мат. ожидание" и "дисперсия", у Вас есть случайная величина. Принимающая, судя по всему, 5 известных значений.

orsobruno в сообщении #412623 писал(а):
будет ли влиять значение дисперсии на результаты


Проясите, пожалуйста, о каких "результатах" речь? Вы генерите случайную выборку и что с ней присходит?

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение13.02.2011, 21:31 


13/02/11
17
Помогите не математику.

Этим все сказано :)

Да, я генерирую выборку с помощью ПРНГ, задача найти такие вероятности, чтобы максимально приблизить результаты выборки к мат ожиданию. Ведь получить вероятности событий можно разными путями и дисперсия будет разной, влияет ли она на качество выборки?

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение13.02.2011, 21:58 
Заслуженный участник


09/09/10
3729
Что такое ПРНГ? И что вам нужно? Генерировать выборку так, чтобы ее матожидание было как можно ближе к заданному числу? Ну так генерируйте выборку, распределенную по нормальному закону с параметрами $a,\,\sigma^2$, где $a$ — ваше заданное матожидание. Насчет выбора $\sigma^2$ — есть какие-то на нее условия, чтобы выборочное матожидание отличалось от истинного не более чем на $\varepsilon$ с уровнем значимости $\gamma$, но я их не помню.

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение13.02.2011, 22:06 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Выборка - это набор чисел. Выборка объема $N$ - это $(x_1,\ldots,x_N)$

Я по-прежнему не понимаю, что такое "результат выборки" (по какой формуле он считается?) и что такое "качество выборки". Вы используете эти термины, так объясните точно, какой смысл в них вкладываете.

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение13.02.2011, 22:22 


13/02/11
17
Есть значения случайной величины X: 3, 30, 300, 3000

Известно математическое ожидание = 0.65

3*p1+30*p2+300*p3+3000*p4+0*p5=0.65

Задача: найти такое распределение вероятностей (p1,...,pn), при котором результаты выборок объема около 100000 будут максимально близки к мат.ожиданию

ПРНГ = PRNG = pseudo random generator. Соответственно ПРНГ возвращает значение в диапазоне [1,5], в соответствии с функцией распределения. 1 соответствует 3, 2 - 30,...,5 -0

Спасибо за терпение )

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение13.02.2011, 22:33 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Все равно Вы не ответили на вопрос, что такое "результаты выборок". Ну хорошо, будем считать, что это среднее арифметическое всех значений, потому что ничего другого в этой постановке быть не может.

Теперь понятно. Разумеется, в список значений с.в. $X$ нужно добавить 0, что следует из Вашей формулы для вычисления мат. ожидания (ну и мат ожидание должно лежать между минимальным и максимальным значениями).

Разумеется, нужно минимизировать дисперсию. Если бы так случилось, что требуемое мат. ожидание совпало бы с одним из значений $X$, то понятно, что распределение должно быть вырожденным - вероятность 1 приписана этому значению, а вероятность 0 - всем остальным.

Иначе также очевидно, что ненулевая вероятность должна быть приписана двум значениям, между которыми лежит требуемое мат. ожидание. То есть в Вашем примере значениям 30, 300 и 3000 должна быть приписана вероятность 0, то есть их вообще в выборке быть не должно. Значению 0 должна быть приписана вероятность $p$, а значению 3 - вероятность $1-p$, значение $p$ найдете из уравнения для мат. ожидания.

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение13.02.2011, 23:07 


13/02/11
17
что это среднее арифметическое всех значений
вы правы.

30, 300 и 3000 должна быть приписана вероятность 0
условия задачи не позволяют отбрасывать значения.

Разумеется, нужно минимизировать дисперсию

ура. значит даже такой тугодум, как я, это понял. К чему и возвращаемся...

Вопрос как. Мягко говоря не силен в математике. Два дня читал, но пока не понял. К тому же "работа требует работы", а не только чтения.

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение13.02.2011, 23:28 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Увы - вы хотите взаимоисключающих вещей. Для минимизации дисперсии значения должны быть отброшены. Вам это неприемлемо - значит, дисперсия не будет минимальная. Можно только посоветовать задать вероятности значений, удаленных от требуемого математического ожидания, настолько малыми, насколько это допускается практической задачей, которую знаете только Вы.

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение13.02.2011, 23:38 


13/02/11
17
Да, очевидно, что изменять нужно только вероятности. Спасибо за помощь, кофе и думать )

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение13.02.2011, 23:45 
Заслуженный участник


09/09/10
3729
Симплекс-метод вам в помощь. :-(

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение14.02.2011, 10:16 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Я хочу обратить внимание на то, что для тех чисел, которые Вы привели, некоторые вероятности все равно придется делать экстремально малыми. Например, максимально возможное значение вероятности $p_4$, приписанной значению $3000$, может быть равно $\frac{0.65}{3000} = 2.1(6)\cdot 10^{-4}$, это если $p_1=p_2=p_3=0$. И при этом в среднем в последовательности длины 100000 будет всего порядка 21 таких значений, а остальные будут нулями. А если Вы захотите, чтобы остальные вероятности были тоже положительными, то $p_4$ придется сделать еще меньше, и, соответственно, значение 3000 будет встречаться в последовательности еще реже, возможно - всего несколько раз, а будут реализации, в которой это значение вообще не встретится.

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение14.02.2011, 13:26 


13/02/11
17
Вы правы, и я начинаю думать что на результаты у меня влияет не столько дисперсия, сколько малые значения вероятностей для больших значений случайной величины.

Однако, я все равно нахожусь в замешательстве. Сделал 2 распределения вероятностей, в одном дисперсия составляла 11, в другом 33, при учете, что в обоих случаях
значения вероятностей для больших значений случайной величины были малы : $ 3.2 \cdot 10^{-8}$, $ 1.6 \cdot 10^{-6}$. среднее арифметическое в серии тестов для первого случая всегда было лучше второго.

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение14.02.2011, 13:31 
Супермодератор
Аватара пользователя


29/07/05
8248
Москва
Напишите, если не сложно, какие были вероятности в обоих случаях, и несколько полученных значений для первого распределения и для второго.

 Профиль  
                  
 
 Re: Распределение и дисперсия
Сообщение15.02.2011, 17:37 


13/02/11
17
К сожалению удалил тестовый проект. Да и условия задачи содержат положения о том, что количество экспериментов стремится к бесконечности, соответственно значение дисперсии будет нивелироваться по мере возрастания числа экспериментов. Хотя все же хотелось бы найти решение вопроса: как найти ряд распределения случайной величины, зная соответственно значения случайной величины (x1,..,xi), чтобы удовлетворялись 2 условия:
1. значения всех вероятностей p(xi) > 0
2. Дисперсия минимальна

Цитата:
Симплекс-метод вам в помощь


На сколько я понимаю, при решении задачи симплекс-методом на неизвестные накладывается условия неотрицательности, т.е. >= 0. Поэтому в решении системы неравенств может оказаться и 0, для одной или нескольких неизвестных.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 18 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group