2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Excel: Статистика (стандартная задача)
Сообщение18.05.2015, 22:58 
 i  Lia: название изменено на более подходящее.
Дан некий массив данных около 60 чисел.
1) Построить вариационный ряд и статистическое распределение выборки
2) Построить гистограмму относительных частот, разбив интервал на 5-7 частей.
3) Получить несмещенные точечные оценки для матожидания и дисперсии.
4) Найти 95%-е доверительные интервалы для матожидание и дисперсии, предполагая нормальное распределение.
5) Проверить гипотезу о нормальном распределении по критерию хи-квадрат на уровне значимости 0,01.

3) В пункте 3 имеется ввиду по сгруппированным данным или нет? (или из условия не понять?)
Функция в экселе =ДИСП.В выдает смещенную или несмещенную оценку?
4) В формуле для интервала для матожидания будет присутствовать величина $t_{1-\frac{\alpha}{2},n-1}$.
В данном случае $n$ -- это количество интервалов или количество чисел в выборке?
$\alpha=0,95$ или здесь имеется ввиду $0,05$ ?(то есть речь идет про уровень значимости). Как это в эксель вбить?
В формуле =СТЬЮДЕНТ.ОБР нужно указывать вероятность -- это уровень значимости или доверительная вероятность?
В этой же формуле нужно указать число степеней свободы -- это число интервалов или объем выборки?
Такие же вопросы про оценку дисперсии. Там в $\chi^2_{\frac{\alpha+1}{2},n-1}$.
В данном случае $n$ -- это количество интервалов или количество чисел в выборке?
$\alpha=0,95$ или здесь имеется ввиду $0,05$ ?(то есть речь идет про уровень значимости). Как это в эксель вбить?
5) Чтобы по критерию Пирсона проверять гипотезу о нормальном распределении нужны теоретические частоты. Как их с помощью экселя вычислить?
(наверняка там нужно вбивать уровень значимости или доверительную вероятность, а что именно из этого)?

 
 
 
 Re: Статистика.
Сообщение18.05.2015, 23:04 
Аватара пользователя
В п. 3 написано про "сгруппированные данные?
В п. 4 написано про "сгруппированные данные?
Вы читать не обучены, или просто лень прочесть хелп или иное пособие по статистике а Экселе? :shock:

 
 
 
 Posted automatically
Сообщение18.05.2015, 23:08 
 i  Тема перемещена из форума «Помогите решить / разобраться (М)» в форум «Околонаучный софт»

 
 
 
 Re: Excel: Статистика (стандартная задача)
Сообщение19.05.2015, 00:10 
Дело в том, что там не только вопросы по экселю.

-- 19.05.2015, 00:12 --

Brukvalub в сообщении #1016956 писал(а):
В п. 3 написано про "сгруппированные данные?
В п. 4 написано про "сгруппированные данные?
Вы читать не обучены, или просто лень прочесть хелп или иное пособие по статистике а Экселе? :shock:

В пункте 3 и 4 также не написано про несгруппированные данные.

 
 
 
 Re: Excel: Статистика (стандартная задача)
Сообщение19.05.2015, 00:18 
Аватара пользователя
ole-ole-ole в сообщении #1016989 писал(а):
В пункте 3 и 4 также не написано про несгруппированные данные.

Если некто не тонет, но я умею спасать тонущих, то должен я его притопить, чтобы потом спасти? :shock:

 
 
 
 Re: Excel: Статистика (стандартная задача)
Сообщение19.05.2015, 03:54 
Аватара пользователя
Если задан массив, то точечную оценку мо и ско лучше делать по нему. Получится точнее чем по сгруппированным данным. Везде $n$ - это обьем выборки. Количество интервалов используются только для определения степеней свободы функции хи-квадрат.

 
 
 
 Re: Excel: Статистика (стандартная задача)
Сообщение19.05.2015, 15:19 
Аватара пользователя
ole-ole-ole в сообщении #1016953 писал(а):
 i  Lia: название изменено на более подходящее.
...
Функция в экселе =ДИСП.В выдает смещенную или несмещенную оценку?
...
5) Чтобы по критерию Пирсона проверять гипотезу о нормальном распределении нужны теоретические частоты. Как их с помощью экселя вычислить?
(наверняка там нужно вбивать уровень значимости или доверительную вероятность, а что именно из этого)?


А вы сравните ДИСП и ДИСПР - какая даёт больший результат ? Несмещенная (исправленная) оценка больше .

По нормальному распределению. Есть функция НОРМРАСП. Считаете её значение от границ интервалов. То есть НОРМРАСП от правой грницы минус НОРМРАСП от левой. И зачем им уровень значимости ? Им только значение границы, и 2 параметра - мат.ожидание и СКВО.
Кстати, от того, известны ли заранее эти параметры теор. распределения, или в качестве их принимается их оценки, зависит число степеней свободы для хи-квадрат.

 
 
 
 Re: Excel: Статистика (стандартная задача)
Сообщение19.05.2015, 18:09 
Александрович в сообщении #1017015 писал(а):
Если задан массив, то точечную оценку мо и ско лучше делать по нему. Получится точнее чем по сгруппированным данным. Везде $n$ - это обьем выборки. Количество интервалов используются только для определения степеней свободы функции хи-квадрат.

Спасибо! Только хи-квадрат встречается в двух пунктах -- для определения закона распределения и для построения доверительного интервала. В обоих случаях в качестве $n$ нужно брать число интервалов? А как быть с доверительной вероятностью? То есть в эти формулы нужно подставлять ее или уровень значимости?

-- 19.05.2015, 18:11 --

Lahme в сообщении #1017218 писал(а):
ole-ole-ole в сообщении #1016953 писал(а):
 i  Lia: название изменено на более подходящее.
...
Функция в экселе =ДИСП.В выдает смещенную или несмещенную оценку?
...
5) Чтобы по критерию Пирсона проверять гипотезу о нормальном распределении нужны теоретические частоты. Как их с помощью экселя вычислить?
(наверняка там нужно вбивать уровень значимости или доверительную вероятность, а что именно из этого)?


А вы сравните ДИСП и ДИСПР - какая даёт больший результат ? Несмещенная (исправленная) оценка больше .

По нормальному распределению. Есть функция НОРМРАСП. Считаете её значение от границ интервалов. То есть НОРМРАСП от правой грницы минус НОРМРАСП от левой. И зачем им уровень значимости ? Им только значение границы, и 2 параметра - мат.ожидание и СКВО.
Кстати, от того, известны ли заранее эти параметры теор. распределения, или в качестве их принимается их оценки, зависит число степеней свободы для хи-квадрат.

Спасибо! ТО есть нужно подставлять доверительную вероятность!

 
 
 
 Re: Excel: Статистика (стандартная задача)
Сообщение19.05.2015, 18:15 
Lahme в сообщении #1017218 писал(а):
По нормальному распределению. Есть функция НОРМРАСП. Считаете её значение от границ интервалов. То есть НОРМРАСП от правой грницы минус НОРМРАСП от левой. И зачем им уровень значимости ? Им только значение границы, и 2 параметра - мат.ожидание и СКВО.
Кстати, от того, известны ли заранее эти параметры теор. распределения, или в качестве их принимается их оценки, зависит число степеней свободы для хи-квадрат.

ole-ole-ole в сообщении #1017327 писал(а):
Спасибо! ТО есть нужно подставлять доверительную вероятность!

Куда Вы ее собрались подставлять в этом контексте? Теоретические частоты каким боком зависят от доверительной вероятности?

 
 
 
 Re: Excel: Статистика (стандартная задача)
Сообщение19.05.2015, 18:37 
Аватара пользователя
Для определения доверительного интервала для дисперсии $n$ это обьем выборки. Уровень значимости применяется для проверки гипотез.

 
 
 
 Re: Excel: Статистика (стандартная задача)
Сообщение19.05.2015, 20:21 
Otta в сообщении #1017338 писал(а):
Lahme в сообщении #1017218 писал(а):
Куда Вы ее собрались подставлять в этом контексте? Теоретические частоты каким боком зависят от доверительной вероятности?

Да я имел ввиду доверительные интервалы. Уже понял, что туда нужно только доверительную вероятность подставлять, а уровень значимости тут не причем.

 
 
 
 Re: Excel: Статистика (стандартная задача)
Сообщение19.05.2015, 20:30 
Куда - туда? Что значит фраза
ole-ole-ole в сообщении #1017442 писал(а):
доверительную вероятность подставлять, а уровень значимости тут не причем.

если уровень значимости и доверительная вероятность тесно связаны?
Совершенно непонятно, что и как Вы считаете.

 
 
 
 Re: Excel: Статистика (стандартная задача)
Сообщение19.05.2015, 23:34 
Когда рассматриваю доверительный интервал для матожидания (дисперсия неизвестна)

$\mathbb{P}\left( \bar{X} - t_{1-\frac{\alpha}{2},n-1} \frac{S}{\sqrt{n}} \le \mu \le \bar{X} + t_{1-\frac{\alpha}{2},n-1} \frac{S}{\sqrt{n}}\right) = 1-\alpha$

Подставляю $\alpha=0,95$. Но по смыслу формулы, что вероятность равна $1-\alpha$ кажется, что именно $\alpha$ здесь уровень значимости.

К примеру, если доверительная вероятность $0,95$ и объем выборки $60$, то $t_{1-\frac{\alpha}{2},n-1}=t_{0,525;59}$

По таблице распределения Стьюдента http://www.exponenta.ru/educat/referat/ ... abt-st.pdf нет значения 0,525 и даже 0,475.

Видно что-то делаю не так. Видно $\alpha=0,05$ и тогда $1-\frac{\alpha}{2}=0,975$ и тогда по таблице смотрим $0,025$ (что-то среднее между $0,01$ и $0,05$) где-то $2,3$ получается.

Есть ли что-то верное в этом?

-- 19.05.2015, 23:49 --

Так как это уже не "околонаучный софт" создал тему отдельно про доверительные интервалы.

 
 
 [ Сообщений: 13 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group