2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему
 
 Статистика
Сообщение13.04.2010, 02:35 


05/06/09
149
Выполнил, что смог. Подскажите, пожалуйста, как действовать дальше! Спасибо заранее)

uмеются следующuе выборочные данные (выборка 10%-ная, механuческая) о выпуске продукцuu и сумме прибылu, млн. руб.:

\begin{tabular}{|c|c|c|c|c|c|}
\hline
\text{№ предприятия}&\text{выпуск продукции}&\text{прибыль}&\text{№ предприятия}&\text{выпуск продукции}&\text{прибыль}\\
\hline
1 & 62,0 & 15,7 & 16 & 52,0 & 14,6 \\
\hline
2 &  78,0 & 18,0 & 17 & 62,0 & 14,8\\
\hline
3 &  41,0 & 12,1 & 18 & 69,0 & 16,1\\
\hline
4 &  54,0 & 13,8 & 19 & 85,0 & 16,7\\
\hline
5 &  62,0 & 15,5 & 20 & 72,0 & 15,8\\
\hline
6 &  24,0 & 14,0 & 21 & 71,0 & 16,4\\
\hline
7 &  45,0 & 12,8 & 22 & 34,0 & 14,0\\
\hline
8 &  57,0 & 14,2 & 23 & 72,0 & 16,5\\
\hline
9 &  67,0 & 15,9 & 24 & 88,0 & 18,5\\
\hline
10 & 82,0 & 17,6 & 25 & 72,0 & 16,4\\
\hline
11 & 92,0 & 18,2 & 26 & 74,0 & 16,0\\
\hline
12 & 48,0 & 9,0 & 27 & 96,0 & 19,1\\
\hline
13 & 59,0 & 16,5 & 28 & 75,0 & 16,3\\
\hline
14 & 68,0 & 16,2 & 29 & 101,0 & 19,6\\
\hline
15 & 82,0 & 16,7 & 30 & 72,0 & 17,2\\
\hline
\end{tabular}

1) Определите коэффициенты выборочного уровня регрессии $\overline y_x = b_0 + b_1(x-\overline x)$

$X$ - выпуск продукции

$Y$ - прибыль

$\overline y_x-\overline y=\dfrac{k(X,Y)}{\overline D_x}(x-\overline x)$

$\overline x=\dfrac{1}{30}\sum\limits_{i=1}^{30}x_n = 67,2$

$\overline y=\dfrac{1}{30}\sum\limits_{i=1}^{30}y_n=15,80(6)$

Для того, чтобы посчитать ковариацию $k(X,Y)$ в экселе, там нужно ввести два целочисленные массива...
Для удобства я скопирую их сюда

$X$
(9;12,1;12,8;13,8;14;14;14,2;14,6;14,8;15,5;15,7;15,8;15,9;16;16,1;16,2;16,3;16,4;16,4;16,5;16,5;16,7;16,7;17,2;17,6;18;18,2;18,5;19,1;19,6)
$Y$
(62;78;41;54;62;24;45;57;67;82;92;48;59;68;82;52;62;69;85;72;71;34;72;74;96;75;101;72)

Но ведь тут не целочисленные массивы....

Правильная ли мысль дальше? Допустим, мы нашли ковариацию $k(X,Y)=k_0$

$\overline D_x=\dfrac{1}{30}\sum\limits_{i=1}^{30}x_n^2-(\overline x)^2=c$

2) Установите наличие и характер корреляционной связи между стоимостью произведенной продукции $X$ и суммой прибыли на одно предприятие $Y$. Постройте диаграмму рассеяния и линию регрессии.

3) Рассчитайте линейный коэффициент корреляции. Используя критерий Стьюдента, проверьте значимость коэффициента корреляции. Сделайте вывод о тесноте связи между факторами $X$ и $Y$, используя шкалу Чеддока.

 Профиль  
                  
 
 Re: Статистика
Сообщение13.04.2010, 17:03 
Заслуженный участник


08/09/07
841
oleg-spbu в сообщении #308920 писал(а):
Для того, чтобы посчитать ковариацию $k(X,Y)$ в экселе, там нужно ввести два целочисленные массива...

С чего Вы это взяли? Какую Вы функцию используйте? Для подсчёта ковариации в Excel требуется указать два массива данных, и они не обязательно должны быть целочисленными.

oleg-spbu в сообщении #308920 писал(а):
Правильная ли мысль дальше? Допустим, мы нашли ковариацию $k(X,Y)=k_0$
$\overline D_x=\dfrac{1}{30}\sum\limits_{i=1}^{30}x_n^2-(\overline x)^2=c$

Не понятно, что Вы здесь спрашиваете?

 Профиль  
                  
 
 Re: Статистика
Сообщение14.04.2010, 00:09 


05/06/09
149
Цитата:
С чего Вы это взяли? Какую Вы функцию используйте? Для подсчёта ковариации в Excel требуется указать два массива данных, и они не обязательно должны быть целочисленными.


=КОВАР("9;12,1;12,8;13,8;14;14;14,2;14,6;14,8;15,5;15,7;15,8;15,9;16;16,1;16,2;
16,3;16,4;16,4;16,5;16,5;16,7;16,7;17,2;17,6;18;18,2;18,5;19,1;19,6";"62;78;41;54;
62;24;45;57;67;82;92;48;59;68;82;52;62;69;85;72;71;34;72;74;96;75;101;72")

Выдает ошибку(((

Цитата:
Не понятно, что Вы здесь спрашиваете?
[/quote]

Эмс, я тут не спрашивал, а просто написал, будто бы я посчитал дисперсию)

 Профиль  
                  
 
 Re: Статистика
Сообщение14.04.2010, 00:46 
Заслуженный участник


08/09/07
841
oleg-spbu в сообщении #309246 писал(а):

=КОВАР("9;12,1;12,8;13,8;14;14;14,2;14,6;14,8;15,5;15,7;15,8;15,9;16;16,1;16,2;
16,3;16,4;16,4;16,5;16,5;16,7;16,7;17,2;17,6;18;18,2;18,5;19,1;19,6";"62;78;41;54;
62;24;45;57;67;82;92;48;59;68;82;52;62;69;85;72;71;34;72;74;96;75;101;72")

Выдает ошибку(((

А почему Вы так массив задаёте? Наберите данные по прибыли в первый столбец A в строки с 1 по 100, затем во второй стобец B наберите данные по производству в строки с 1 по 100, и затем просто укажите массивы как =КОВАР(A1:A100,B1:B100)

 Профиль  
                  
 
 Re: Статистика
Сообщение14.04.2010, 03:50 


05/06/09
149
О! Получилось! коэффициент ковариации 21,93
Спасибо! А он нормирован или нет?!

А что еще тут можно с помощью экселя посчитать?)) Критерий Пирсона можно проверить?)

 Профиль  
                  
 
 Re: Статистика
Сообщение14.04.2010, 04:18 
Заслуженный участник


08/09/07
841
oleg-spbu в сообщении #309272 писал(а):
О! Получилось! коэффициент ковариации 21,93
Спасибо! А он нормирован или нет?!

Нет он не нормирован. Если нормаровать, то это уже коэффициент корреляции.
oleg-spbu в сообщении #309272 писал(а):
А что еще тут можно с помощью экселя посчитать?)) Критерий Пирсона можно проверить?)

Посмотрите в статистических формулах.

 Профиль  
                  
 
 Re: Статистика
Сообщение14.04.2010, 14:15 


05/06/09
149
$\overline D_x=\dfrac{1}{30}\sum\limits_{i=1}^{30}x_n^2-(\overline x)^2\approx 309,6267$
$\overline y_x - 15,8067\approx \dfrac{ 21,93}{309,6267}(x-67,2)$

$$y_x= b_0 + b_1(x-\overline x)=b_0-b_1\overline x+ b_1x \approx 15,8067+0,0708x-4,4409=0,0708x+11,3658$$

=>

$b_1=0,0708$

$b_0-b_1\overline x\approx b_0-0,0708\overline x = 11,3658$

$b_0\approx 16,1236$

 Профиль  
                  
 
 Re: Статистика
Сообщение14.04.2010, 23:12 


05/06/09
149
1) Определите коэффициенты выборочного уровня регрессии $\overline y_x = b_0 + b_1(x-\overline x)$

$X$ - выпуск продукции

$Y$ - прибыль

$\overline x=\dfrac{1}{30}\sum\limits_{i=1}^{30}x_n = 67,2$

$\overline y=\dfrac{1}{30}\sum\limits_{i=1}^{30}y_n=15,80(6)$

$\overline y_x-\overline y=\dfrac{cov(X,Y)}{D(X)}(x-\overline x)$

=> $\overline y_x=\overline y+\dfrac{cov(X,Y)}{D(X)}(x-\overline x)=b_0 + b_1(x-\overline x)$

$cov(X,Y)=31,044$ - ковариация

$D(X)=309,4267$

Сравнивая два выражения для $\overline y_x$, получаем:

$b_0=\overline y=67,2$

$b_1=\dfrac{cov(X,Y)}{D(X)} \approx \dfrac{31,044}{309,4267}\approx 0,1003$

 Профиль  
                  
 
 Re: Статистика
Сообщение15.04.2010, 00:39 


05/06/09
149
$\overline x_y-\overline x=\dfrac{cov(X,Y)}{D(Y)}(y-\overline y)$

$\overline x_y=\overline x+\dfrac{cov(X,Y)}{D(Y)}(y-\overline y)$

$\dfrac{cov(X,Y)}{D(Y)}\approx \dfrac{31,044}{4,7171}\approx 6,5812$

$\overline x_y=15,8067+6,5812(y-67,2)$

$\overline y_x=67,2+0,1003(x-15,0867)$

-- Чт апр 15, 2010 02:05:38 --

Линейный коэффициент корреляции (коэффициент корреляции Пирсона) $r \approx 0,8292$

Изображение

Линии регрессии расположены под малым углом из-за того, что значение коэффициента корреляции близко к $1$.
Изображение

Положительные значения коэффициента корреляции $r$ свидетельствуют о положительной связи между признаками, отрицательные – об отрицательной связи, что нам наглядно иллюстрирует диаграмма (положительный наклон)
У нас случай положительной статистической связи между $X$ и $Y$.

В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату коэффициента корреляции, то есть $R^2 = r^2$

Используя шкалу Чеддока делаем вывод, что у нас высокая(сильная) теснота связи.

 Профиль  
                  
 
 Re: Статистика
Сообщение15.04.2010, 02:11 


05/06/09
149
Проверим статистическую значимость $r$ по критерию Стьюдента:

Из двумерной генеральной совокупности (X, Y) извлечена выборка объёма 30 и по ней найден выборочный коэффициент корреляции $r$, который оказался отличным от нуля. Поскольку выборка отобрана случайно, то нельзя заключить, что коэффициент корреляции генеральной совокупности $r_{\text {ген}}$ также отличен от нуля. Возникает необходимость при данном уровне значимости $\alpha$ проверить о равенстве нулю генерального коэффициента корреляции.

Число степеней свободы $k=30-2=28$
Возьмем уровень значимости $\alpha=0,95$
и по таблице критических точек распределения Стьюдента находим $t_{\text {кр}}=2,05$

$t_{\text {выб}}=r\sqrt {\dfrac{28}{1-r^2}}\approx 7.8499$

Таким образом $t_{\text {выб}} > t_{\text {кр}}$

Поэтому с с доверительной вероятностью $95$% нулевая гипотеза отвергается, это указывает на наличие сильной линейной связи.

-- Чт апр 15, 2010 03:13:30 --

Тем, кто читает тему, тут было очень много арифметических ошибок, которые, вполне вероятно, могли сохранится! Будьте внимательны!

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 10 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group