2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Статистика
Сообщение13.04.2010, 02:35 
Выполнил, что смог. Подскажите, пожалуйста, как действовать дальше! Спасибо заранее)

uмеются следующuе выборочные данные (выборка 10%-ная, механuческая) о выпуске продукцuu и сумме прибылu, млн. руб.:

\begin{tabular}{|c|c|c|c|c|c|}
\hline
\text{№ предприятия}&\text{выпуск продукции}&\text{прибыль}&\text{№ предприятия}&\text{выпуск продукции}&\text{прибыль}\\
\hline
1 & 62,0 & 15,7 & 16 & 52,0 & 14,6 \\
\hline
2 &  78,0 & 18,0 & 17 & 62,0 & 14,8\\
\hline
3 &  41,0 & 12,1 & 18 & 69,0 & 16,1\\
\hline
4 &  54,0 & 13,8 & 19 & 85,0 & 16,7\\
\hline
5 &  62,0 & 15,5 & 20 & 72,0 & 15,8\\
\hline
6 &  24,0 & 14,0 & 21 & 71,0 & 16,4\\
\hline
7 &  45,0 & 12,8 & 22 & 34,0 & 14,0\\
\hline
8 &  57,0 & 14,2 & 23 & 72,0 & 16,5\\
\hline
9 &  67,0 & 15,9 & 24 & 88,0 & 18,5\\
\hline
10 & 82,0 & 17,6 & 25 & 72,0 & 16,4\\
\hline
11 & 92,0 & 18,2 & 26 & 74,0 & 16,0\\
\hline
12 & 48,0 & 9,0 & 27 & 96,0 & 19,1\\
\hline
13 & 59,0 & 16,5 & 28 & 75,0 & 16,3\\
\hline
14 & 68,0 & 16,2 & 29 & 101,0 & 19,6\\
\hline
15 & 82,0 & 16,7 & 30 & 72,0 & 17,2\\
\hline
\end{tabular}

1) Определите коэффициенты выборочного уровня регрессии $\overline y_x = b_0 + b_1(x-\overline x)$

$X$ - выпуск продукции

$Y$ - прибыль

$\overline y_x-\overline y=\dfrac{k(X,Y)}{\overline D_x}(x-\overline x)$

$\overline x=\dfrac{1}{30}\sum\limits_{i=1}^{30}x_n = 67,2$

$\overline y=\dfrac{1}{30}\sum\limits_{i=1}^{30}y_n=15,80(6)$

Для того, чтобы посчитать ковариацию $k(X,Y)$ в экселе, там нужно ввести два целочисленные массива...
Для удобства я скопирую их сюда

$X$
(9;12,1;12,8;13,8;14;14;14,2;14,6;14,8;15,5;15,7;15,8;15,9;16;16,1;16,2;16,3;16,4;16,4;16,5;16,5;16,7;16,7;17,2;17,6;18;18,2;18,5;19,1;19,6)
$Y$
(62;78;41;54;62;24;45;57;67;82;92;48;59;68;82;52;62;69;85;72;71;34;72;74;96;75;101;72)

Но ведь тут не целочисленные массивы....

Правильная ли мысль дальше? Допустим, мы нашли ковариацию $k(X,Y)=k_0$

$\overline D_x=\dfrac{1}{30}\sum\limits_{i=1}^{30}x_n^2-(\overline x)^2=c$

2) Установите наличие и характер корреляционной связи между стоимостью произведенной продукции $X$ и суммой прибыли на одно предприятие $Y$. Постройте диаграмму рассеяния и линию регрессии.

3) Рассчитайте линейный коэффициент корреляции. Используя критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами $X$ и $Y$, используя шкалу Чеддока.

 
 
 
 Re: Статистика
Сообщение13.04.2010, 17:03 
oleg-spbu в сообщении #308920 писал(а):
Для того, чтобы посчитать ковариацию $k(X,Y)$ в экселе, там нужно ввести два целочисленные массива...

С чего Вы это взяли? Какую Вы функцию используйте? Для подсчёта ковариации в Excel требуется указать два массива данных, и они не обязательно должны быть целочисленными.

oleg-spbu в сообщении #308920 писал(а):
Правильная ли мысль дальше? Допустим, мы нашли ковариацию $k(X,Y)=k_0$
$\overline D_x=\dfrac{1}{30}\sum\limits_{i=1}^{30}x_n^2-(\overline x)^2=c$

Не понятно, что Вы здесь спрашиваете?

 
 
 
 Re: Статистика
Сообщение14.04.2010, 00:09 
Цитата:
С чего Вы это взяли? Какую Вы функцию используйте? Для подсчёта ковариации в Excel требуется указать два массива данных, и они не обязательно должны быть целочисленными.


=КОВАР("9;12,1;12,8;13,8;14;14;14,2;14,6;14,8;15,5;15,7;15,8;15,9;16;16,1;16,2;
16,3;16,4;16,4;16,5;16,5;16,7;16,7;17,2;17,6;18;18,2;18,5;19,1;19,6";"62;78;41;54;
62;24;45;57;67;82;92;48;59;68;82;52;62;69;85;72;71;34;72;74;96;75;101;72")

Выдает ошибку(((

Цитата:
Не понятно, что Вы здесь спрашиваете?
[/quote]

Эмс, я тут не спрашивал, а просто написал, будто бы я посчитал дисперсию)

 
 
 
 Re: Статистика
Сообщение14.04.2010, 00:46 
oleg-spbu в сообщении #309246 писал(а):

=КОВАР("9;12,1;12,8;13,8;14;14;14,2;14,6;14,8;15,5;15,7;15,8;15,9;16;16,1;16,2;
16,3;16,4;16,4;16,5;16,5;16,7;16,7;17,2;17,6;18;18,2;18,5;19,1;19,6";"62;78;41;54;
62;24;45;57;67;82;92;48;59;68;82;52;62;69;85;72;71;34;72;74;96;75;101;72")

Выдает ошибку(((

А почему Вы так массив задаёте? Наберите данные по прибыли в первый столбец A в строки с 1 по 100, затем во второй стобец B наберите данные по производству в строки с 1 по 100, и затем просто укажите массивы как =КОВАР(A1:A100,B1:B100)

 
 
 
 Re: Статистика
Сообщение14.04.2010, 03:50 
О! Получилось! коэффициент ковариации 21,93
Спасибо! А он нормирован или нет?!

А что еще тут можно с помощью экселя посчитать?)) Критерий Пирсона можно проверить?)

 
 
 
 Re: Статистика
Сообщение14.04.2010, 04:18 
oleg-spbu в сообщении #309272 писал(а):
О! Получилось! коэффициент ковариации 21,93
Спасибо! А он нормирован или нет?!

Нет он не нормирован. Если нормаровать, то это уже коэффициент корреляции.
oleg-spbu в сообщении #309272 писал(а):
А что еще тут можно с помощью экселя посчитать?)) Критерий Пирсона можно проверить?)

Посмотрите в статистических формулах.

 
 
 
 Re: Статистика
Сообщение14.04.2010, 14:15 
$\overline D_x=\dfrac{1}{30}\sum\limits_{i=1}^{30}x_n^2-(\overline x)^2\approx 309,6267$
$\overline y_x - 15,8067\approx \dfrac{ 21,93}{309,6267}(x-67,2)$

$$y_x= b_0 + b_1(x-\overline x)=b_0-b_1\overline x+ b_1x \approx 15,8067+0,0708x-4,4409=0,0708x+11,3658$$

=>

$b_1=0,0708$

$b_0-b_1\overline x\approx b_0-0,0708\overline x = 11,3658$

$b_0\approx 16,1236$

 
 
 
 Re: Статистика
Сообщение14.04.2010, 23:12 
1) Определите коэффициенты выборочного уровня регрессии $\overline y_x = b_0 + b_1(x-\overline x)$

$X$ - выпуск продукции

$Y$ - прибыль

$\overline x=\dfrac{1}{30}\sum\limits_{i=1}^{30}x_n = 67,2$

$\overline y=\dfrac{1}{30}\sum\limits_{i=1}^{30}y_n=15,80(6)$

$\overline y_x-\overline y=\dfrac{cov(X,Y)}{D(X)}(x-\overline x)$

=> $\overline y_x=\overline y+\dfrac{cov(X,Y)}{D(X)}(x-\overline x)=b_0 + b_1(x-\overline x)$

$cov(X,Y)=31,044$ - ковариация

$D(X)=309,4267$

Сравнивая два выражения для $\overline y_x$, получаем:

$b_0=\overline y=67,2$

$b_1=\dfrac{cov(X,Y)}{D(X)} \approx \dfrac{31,044}{309,4267}\approx 0,1003$

 
 
 
 Re: Статистика
Сообщение15.04.2010, 00:39 
$\overline x_y-\overline x=\dfrac{cov(X,Y)}{D(Y)}(y-\overline y)$

$\overline x_y=\overline x+\dfrac{cov(X,Y)}{D(Y)}(y-\overline y)$

$\dfrac{cov(X,Y)}{D(Y)}\approx \dfrac{31,044}{4,7171}\approx 6,5812$

$\overline x_y=15,8067+6,5812(y-67,2)$

$\overline y_x=67,2+0,1003(x-15,0867)$

-- Чт апр 15, 2010 02:05:38 --

Линейный коэффициент корреляции (коэффициент корреляции Пирсона) $r \approx 0,8292$

Изображение

Линии регрессии расположены под малым углом из-за того, что значение коэффициента корреляции близко к $1$.
Изображение

Положительные значения коэффициента корреляции $r$ свидетельствуют о положительной связи между признаками, отрицательные – об отрицательной связи, что нам наглядно иллюстрирует диаграмма (положительный наклон)
У нас случай положительной статистической связи между $X$ и $Y$.

В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату коэффициента корреляции, то есть $R^2 = r^2$

Используя шкалу Чеддока делаем вывод, что у нас высокая(сильная) теснота связи.

 
 
 
 Re: Статистика
Сообщение15.04.2010, 02:11 
Проверим статистическую значимость $r$ по критерию Стьюдента:

Из двумерной генеральной совокупности (X, Y) извлечена выборка объёма 30 и по ней найден выборочный коэффициент корреляции $r$, который оказался отличным от нуля. Поскольку выборка отобрана случайно, то нельзя заключить, что коэффициент корреляции генеральной совокупности $r_{\text {ген}}$ также отличен от нуля. Возникает необходимость при данном уровне значимости $\alpha$ проверить о равенстве нулю генерального коэффициента корреляции.

Число степеней свободы $k=30-2=28$
Возьмем уровень значимости $\alpha=0,95$
и по таблице критических точек распределения Стьюдента находим $t_{\text {кр}}=2,05$

$t_{\text {выб}}=r\sqrt {\dfrac{28}{1-r^2}}\approx 7.8499$

Таким образом $t_{\text {выб}} > t_{\text {кр}}$

Поэтому с с доверительной вероятностью $95$% нулевая гипотеза отвергается, это указывает на наличие сильной линейной связи.

-- Чт апр 15, 2010 03:13:30 --

Тем, кто читает тему, тут было очень много арифметических ошибок, которые, вполне вероятно, могли сохранится! Будьте внимательны!

 
 
 [ Сообщений: 10 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group