2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 помогите с задачей по статистике
Сообщение26.05.2006, 16:17 


26/05/06
44
подскажите как решить простую задачу по статистике

проводится опрос в котором 40 вопросов у каждого вопроса 5 вариантов ответа(если эта информация нужна для решения)
всего есть 170 человек
уровень доверия 90%

как определить сколько надо чтоб ответило людей
чтоб опрос был правдивым при заданом уровне доверия ?

я так понимаю что для решения нужно знать максимально отклонение дисперсия
как ее посчитать если у меня есть опрос который проводился раньше ?


за рание спасибо

 Профиль  
                  
 
 
Сообщение26.05.2006, 20:40 


25/07/05
20
Цитата:

проводится опрос в котором 40 вопросов у каждого вопроса 5 вариантов ответа(если эта информация нужна для решения)
всего есть 170 человек
уровень доверия 90%

как определить сколько надо чтоб ответило людей

имеется в виду максимальный объем выборки 170?
Цитата:
чтоб опрос был правдивым при заданом уровне доверия ?

что понимается под понятием "правдивый"?
Цитата:
я так понимаю что для решения нужно знать максимально отклонение дисперсия

Если считать, что ответы считать независимыми, то можно рассмотреть только ответы на один из вопросов. Можно воспользоваться законом больших чисел. Максимальная дисперсия будет при равномерном распределении вариантов ответов.
Цитата:
как ее посчитать если у меня есть опрос который проводился раньше ?

можно вычислить выборочную дисперсию и взять ее в качестве приближенного значения дисперсии.
З.Ы. нужно наверное еще указать максимальное уклонение выборочной частоты от вероятности (для того чтобы определить понятие правдивости)

 Профиль  
                  
 
 
Сообщение27.05.2006, 02:04 
Экс-модератор


12/06/05
1595
MSU
Цитата:
Максимальная дисперсия будет при равномерном распределении вариантов ответов.

Почему? Если ответы на вопросы - это числа, то максимальная дисперсия будет, если мы нагрузим пополам минимальное и максимальное значения.
При равномерном распределении максимизируется энтропия.

Invisible, пожалуйста, конкретизируйте условие, а то не все понятно.

 Профиль  
                  
 
 
Сообщение27.05.2006, 10:34 


26/05/06
44
Цитата:
имеется в виду максимальный объем выборки 170?

да, это максимальное число человек которое как предполагается будет участвовать в опросе

то есть получается максимальный объем

Цитата:
что понимается под понятием "правдивый"?

проблема в том что эта задача не из учебника
мне дали такую задачу, сказав ее устно
на сколько я понимаю под "правдивым" понимается что:
есть опрос в котором должны принять участия 170 человек
но может быть такое, что не все люди из 170 согласятся его пройти.
И вот допустим в опросе приняло участие N человек (из 170 т.е.
$N\leqslant 170)
мне надо определить можно ли полагаться на этот опрос,(в котором
приняло участие N человек из 170), как на достоверный
при уровне доверия 90%


Цитата:
Почему? Если ответы на вопросы - это числа

ответы на вопросы это числа
но каждому числу соответствует уровень вашего отношение к определенному вопросу
пример вопроса:
Какой то вопрос...
варианты ответа:
1. ужасно
2. плохо
3. нормально
4. хорошо
5. очень хорошо

и на все вопросы одни и те же варианты ответа.

поскольку тут прозвучало несколько способов поиска дисперсии
на каком остановится?

Цитата:
Invisible, пожалуйста, конкретизируйте условие, а то не все понятно.


если еще есть вопросы, задавайте
постараюсь ответить

заранее всем большое спасибо за помощь.

 Профиль  
                  
 
 
Сообщение27.05.2006, 23:09 


25/07/05
20
Можно посмотреть учебник Кремер Н.Ш. "Теория вероятностей и математическая статистика".
Объем выборки $n$, необходимый для определения отклонения выборочного мат. ожидания $\overline{x}$ от истинного $\overline{x}_0$ на величину не большую $\delta$ с надежностью $\gamma$
$\mathbf{P}(|\overline{x}-\overline{x}_0| \leqslant \delta) = \gamma $
вычисляется по формуле:
$n = \frac {Nt^2\sigma^2} {t^2\sigma^2 + N\delta^2}$
где $N=170$ - максимальный объем выборки;
$t=u_{\frac{1+\gamma}{2}} = 1,64$ - квантиль нормального распределения;
${\gamma} = 0,90$ - заданная надежность (уровень доверия);
$\sigma^2$ - величина дисперсии (максимальная величина дисперсии, как совершенно правильно указал выше уважаемый модератор, будет в случае равномерной загрузки минимального и максимального значения).
Если метки обозначить 1 - ужасно; ... ; 5 - очень хорошо, тогда максимальная величина дисперсии равна 4.

Здесь, по отношению к Вашей задаче, меня смущают следующее:
- ГС, представляет собой случайный вектор (из 40 элементов), а не случайную величину;
- при определении вероятности - использование нормальной аппроксимацией (наверное можно воспользоватся ЦПТ);
- не совсем понятно из каких соображений выбирать $\delta$.

 Профиль  
                  
 
 
Сообщение28.05.2006, 01:36 
Экс-модератор


12/06/05
1595
MSU
У меня получилось практически то же самое, только в знаменателе N-1, а не N. Похоже, я чего-то не учитываю. Вы не могли бы привести точную формулировку задачи из Крамера, которую решает данная формула?
Цитата:
Здесь, по отношению к Вашей задаче, меня смущают следующее:
- ГС, представляет собой случайный вектор (из 40 элементов), а не случайную величину;
- при определении вероятности - использование нормальной аппроксимацией (наверное можно воспользоватся ЦПТ);
- не совсем понятно из каких соображений выбирать $\delta$

- да, формула будет работать для оценки результатов опроса в сокращенной выборке по каждому конкретному вопросу из сорока. Ей можно воспользоваться, если нас не будет интересовать, как изучаемые в вопросах величины связаны друг с другом. А если будет интересовать, то надо что-то другое придумывать.
- обычно так и делают. К тому же вы ей уже воспользовались, когда написали t=1,64.
- а это должен выбирать исследователь. В этом месте исходная задача недопоставлена, число $\delta$ должно быть задано.

Invisible, если что-то непонятно, задавайте вопросы =))

 Профиль  
                  
 
 
Сообщение28.05.2006, 07:38 


25/07/05
20
В формуле исправил $u_{1+\frac{\gamma}{2}}$ на правильное $u_{\frac{1+\gamma}{2}}$.
Цитата:
Вы не могли бы привести точную формулировку задачи из Крамера, которую решает данная формула?


В принципе постановка задачи дана в предыдущем сообщении:

Рассматривается ГС, состоящая из $N$ элементов. Необходимо определить объем бесповторной выборки $n$, необходимый для определения отклонения выборочного мат. ожидания $\overline{x}$ от истинного $\overline{x}_0$ на величину не большую $\delta$ с надежностью $\gamma$:

$\mathbf{P}(|\overline{x}-\overline{x}_0| \leqslant \delta)=\gamma$

Да, Вы правы. Нашел теорему (там же у Кремера):
${\sigma_{\overline{x}}} = \sqrt{\frac{\sigma^2}n(\frac{N-n}{N-1})} $
Вот где собака зарыта ).

Хотя при вычислении объема выборки используют "упрощение":
${\sigma_{\overline{x}}} \approx \sqrt{\frac{s^2}n(1- \frac n N)} $,
где $s^2 \approx \sigma^2$ - выборочная дисперсия.

З.Ы. Формулировка из учебника Н.Ш. Кремера, а не Г. Крамера, как могло бы показаться ).

 Профиль  
                  
 
 
Сообщение28.05.2006, 08:33 
Заслуженный участник
Аватара пользователя


23/07/05
17976
Москва
vsufiy писал(а):
Рассматривается ГС, состоящая из $N$ элементов.


Вообще-то, $N=170$ - это, как я понял, не объём генеральной совокупности. Генеральная совокупность здесь гораздо больше. А $N$ - это просто ограничение на объём выборки: не разрешается выбирать больше и всё тут (точнее, ожидается, что большего количества подопытных просто не будет - не потому, что их нет вообще, а потому, что они не пожелают участвовать в опросе).

P.S. "$\approx$" кодируется как \approx.

 Профиль  
                  
 
 To Someone
Сообщение28.05.2006, 08:37 


25/07/05
20
Invisible
:
Цитата:
есть опрос в котором должны принять участия 170 человек
но может быть такое, что не все люди из 170 согласятся его пройти.

 Профиль  
                  
 
 To Someone
Сообщение28.05.2006, 08:52 


25/07/05
20
В Вашем случае, для определения достаточного объема выборки можно воспользоваться предельным переходом:
$$
n = \frac{{t^2}\sigma^2}{\delta^2}
$$
при $N \to \infty$.

 Профиль  
                  
 
 
Сообщение28.05.2006, 10:28 
Экс-модератор


12/06/05
1595
MSU
vsufiy писал(а):
Хотя при вычислении объема выборки используют "упрощение":
${\sigma_{\overline{x}}} \approx \sqrt{\frac{s^2}n(1- \frac n N)} $,
где $s^2 \approx \sigma^2$ - выборочная дисперсия.

Во, точно, спасибо. А то я как-то забыл, откуда возникает разница с N и N-1.

 Профиль  
                  
 
 
Сообщение28.05.2006, 20:00 


26/05/06
44
Цитата:
Invisible, если что-то непонятно, задавайте вопросы =))

спрашиваю )

на сколько я понял то для каждого вопроса надо считать отдельно?
тоесть возьмем один из вопросов
на вопросе ответило 29 человек
за 1 проголосовал 1 чел.
за 2 проголосовало 2 чел.
за 3 проголосовал 12 чел.
за 4 проголосовало 13 чел.
за 5 проголосовал 1 чел.
тоесть итого 29 чел. ответило на вопрос.

Цитата:
Объем выборки $n$, необходимый для определения отклонения выборочного мат. ожидания $\overline{x}$ от истинного $\overline{x}_0$ на величину не большую $\delta$ с надежностью $\gamma$
$\mathbf{P}(|\overline{x}-\overline{x}_0| \leqslant \delta) = \gamma $


как мне найти $\delta$ ?

Цитата:
Изображение

t это табличное значение ?

vsufiy писал(а):
В Вашем случае, для определения достаточного объема выборки можно воспользоваться предельным переходом:
$$
n = \frac{{t^2}\sigma^2}{\delta^2}
$$
при $N \to \infty$.

вы выше писали что n это объем выборки.
тоесть если на вопрос ответило 29 человек ( как я писал выше для примера)
то n= 29

и искать мне надо $\delta$ ?

 Профиль  
                  
 
 To Invisible
Сообщение28.05.2006, 20:48 


25/07/05
20
1. Обычно $\delta$ задается.
2. В принципе если известен объем выборки, то Вы можете вычислить эту величину $\delta$.
3. Вы так и не ответили на вопрос о том, что значит "правдивый"
Цитата:
на сколько я понимаю под "правдивым" понимается что:
есть опрос в котором должны принять участия 170 человек
но может быть такое, что не все люди из 170 согласятся его пройти.

это не объяснение...
4. Someone задал вопрос, на который следовало бы ответить:
выборка может браться только из ГС, состоящей из 170 элементов,
или возможно, что ГС может быть больше (например, если вы рассматриваете группы одного факультета, в котором 170 студентов - это одно, а если 170 чел. - это клиенты магазина, которых может быть и больше, то это другое).
5. Да $n=29$ - это объем выборки. $t=u_{0,95}$ - это табличное значение квантили стандартного нормального распределения.
6. Нужно рассматривать репрезентативные выборки. Если некоторые респонденты не хотят отвечать, выборка может быть и не репрезентативной.
7. Изучите хоть немного литературу по мат. статистике, чтобы мы разговаривали на одном языке.
8. Данное выше решение - только одно из возможных, которое имеется в учебной литературе.
9. Может быть все - таки дадите постановку задачи, так как она звучит на самом деле полностью.

 Профиль  
                  
 
 
Сообщение29.05.2006, 07:26 
Экс-модератор


12/06/05
1595
MSU
vsufiy:
По-моему, нужно помочь Invisible поставить задачу =))

 Профиль  
                  
 
 
Сообщение29.05.2006, 18:14 


26/05/06
44
более точной формулировки задачи у меня нету

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 17 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group