2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Задача по статистике
Сообщение30.07.2009, 14:22 


27/03/09
213
Для определения сроков пользования краткосрочным кредитом в коммерческом банке города была проведена 5% случайная бесповторная выборка лицевых счетов, в результате которой получено следующее распределение клиентов по сроку пользования кредитом:
Срок пользования кредитом (дней) Число вкладчиков (чел.)
До 30 60
30 – 45 40
45 – 60 120
60 – 75 80
Свыше 75 50

1. По данным таблицы постройте не менее трёх видов статистических графиков, возможных для этого исследования.
2. Вычислите:
численность генеральной совокупности,
средний срок пользования кредитом,
моду и медиану данного ряда распределения
дисперсию выборки.

3. С вероятностью 0,954 определите необходимую численность выборки при определении среднего срока кредита, чтобы не ошибиться более чем на 5 дней.
4. Определите долю вкладчиков в банке со сроком кредита свыше 60 дней. Определите с вероятностью 0,954, в каких пределах находится число таких клиентов.

Подсткажите, пожалуйста, какую литературу взять для решения этой задачи? Где будут все эти понятия?
Спасибо.

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение30.07.2009, 23:11 
Заблокирован


16/03/06

932
Задание составлено не очень аккуратно. Много неопределенностей.

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение31.07.2009, 07:39 


27/03/09
213
Архипов в сообщении #232135 писал(а):
Задание составлено не очень аккуратно. Много неопределенностей.


А что именно составляет неопределенность?

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение31.07.2009, 10:52 


25/05/09
231
NatNiM в сообщении #232023 писал(а):

Подсткажите, пожалуйста, какую литературу взять для решения этой задачи? Где будут все эти понятия?
Спасибо.
Я решал много таких.Нижеупомянутые книги читать не пришлось, но если найдете:

«Эконометрика – это не то же самое, что экономическая статистика. Она не идентична и тому, что мы называем экономической теорией, хотя значительная часть этой теории носит количественный характер. Эконометрика не является синонимом приложений математики к экономике. Как показывает опыт, каждая из трех отправных точек – статистика, экономическая теория и математика – необходимое, но не достаточное условие для понимания количественных соотношений в современной экономической жизни. Это единство всех трех составляющих. И это единство образует эконометрику.» – Frisch R. Editorial. Econometrica. – 1933. – № 1. – P. 2.



При решении задач используется следующая литература:

1. Эконометрика: Учебник / Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2006. – 576 с.

2. Практикум по эконометрике: Учеб. пособие / Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2006. – 344 с.

3. Эконометрика: Учебно-методическое пособие / Шалабанов А.К., Роганов Д.А. – Казань: Издательский центр Академии управления «ТИСБИ», 2004. – 198 с.

4. Доугерти К. Введение в эконометрику: Пер. с англ. – М.: ИНФРА-М, 1999. – 402 с.

5. Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов / Под ред. проф. Н.Ш. Кремера. – М.: ЮНИТИ-ДАНА, 2002. – 311 с.

6. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учебник. – М.: Дело, 2001. – 400 с.

7. Катышев П.К., Магнус Я.Р., Пересецкий А.А. Сборник задач к начальному курсу эконометрики. – М.: Дело, 2002. – 208 с.

8. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2-х т. – Т. 1. Айвазян С.А., Мхитарян В.С. Теория вероятностей и прикладная статистика. – М: ЮНИТИ-ДАНА, 2001. – 656 с.

9. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2-х т. – Т. 2. Айвазян С.А. Основы эконометрики. – М: ЮНИТИ-ДАНА, 2001. – 432 с.

10. Эконометрика: Учебник / Тихомиров Н.П., Дорохина Е.Ю. – М.: Издательство «Экзамен», 2003. – 512 с. (Программа курса, Учебник: часть 1, часть 2, часть 3, часть 4)

11. Сборник задач по эконометрике: Учебное пособие для студентов экономических вузов / Сост. Е.Ю. Дорохина, Л.Ф. Преснякова, Н.П. Тихомиров. - М.: Издательство «Экзамен», 2003. - 224 с.

12. Эконометрика: Учеб. пособие для вузов / А.И. Орлов – М.: Издательство «Экзамен», 2002. – 576 с.

13. Кулинич Е.И. Эконометрия. – М.: Финансы и статистика, 2001.– 304 с.

14. Мардас А.Н. Эконометрика. – СПб: Питер, 2001. – 144 с
Источник: http://reshebnik.ru Но у них дороже раза в 3. Кстати на мой взгляд неточен только 1 пункт. Возможно преп считает,что гистограмма и круговая диаграмма от Excel- разные хотя по сути одно и то же

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение31.07.2009, 12:30 


27/03/09
213
Спасибо! Первые 2 книги у меня есть, уже читаю

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение01.08.2009, 21:24 


27/03/09
213
Появились вопросы.
1. Графики подходят только гисторамма частот и гистограмма относительных частот, хотя как быть с неравными интервалами и не закрытыми левой и правой границей (<30 и >75)?
2. Не могу понять, как вычислить средний срок пользования кредитом, не имея значения вероятности, с которой необходимо установить это значение.
3. Не ясно, какую формулу использовать, имея данные "чтобы не ошибиться не более чем на 5 дней".

Спасибо.

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение01.08.2009, 23:19 
Заблокирован


16/03/06

932
1) С гистограммами проблем нет, просто в области аргумента записать "менее 30", "более 75".
2) А для вычисления среднего значения срока , действительно, возникает трудность, о чем уже говорилось. С "менее 30" еще можно выкрутиться, так как минимальный срок можно установить в 1 сутки, но "более 75" не имеет предела.
3) Если не устранить неопределенности, о чем говорится в пункте 2), то дальнейшие выкладки бесполезны.

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение02.08.2009, 10:19 


25/05/09
231
NatNiM в сообщении #232427 писал(а):
Появились вопросы.
1. Графики подходят только гисторамма частот и гистограмма относительных частот, хотя как быть с неравными интервалами и не закрытыми левой и правой границей (<30 и >75)?
2. Не могу понять, как вычислить средний срок пользования кредитом, не имея значения вероятности, с которой необходимо установить это значение.
3. Не ясно, какую формулу использовать, имея данные "чтобы не ошибиться не более чем на 5 дней".

Спасибо.
Первый раз (год назад) и у меня они возникали. Пришлось проглядеть их лекционные курсы. (Книгу-первоисточник так и не выяснил.Но она явно одна и та же для этого раздела курса -условно"Выборочный анализ"- не менее чем в трех вузах).Вот что запомнил.
1.Характерные значения на каждом интервале, по возможности, надо выбирать равноудаленными друг от друга, здесь крайние "характерные значения" 22,5 и 82,5.Их и использовать для подсчета среднего. Мотивировка(моя): людей, которые готовят эти таблицы, тоже чему-то учат, в тч что интервалы группировки надо выбирать равные.(Правда есть условие Стерджесса на количество интервалов :не более 1+$\log_2{N}$ но здесь-то оно выполняется с запасом).Поэтому если бы имелся в выборке хоть один кредит сроком <15, он был бы отражен в таблице.Тем самым эта строка таблицы дает две информации:от 15 до 30 указано, <15 ни одного.Аналогично по верхней границе.
Третью статистическую таблицу(если уж нет возможности посмотреть у бедняги текст лекций) я бы взял ступенчатый вид функции распределения (растущей от 0 до1) -по нему хорошо видна медиана.Мне эта проблема не встречалась.

2.Доверительный интервал для среднего
$(a-t\sigma\sqrt{\dfrac{1}{n}(1-\dfrac{n}{N}},a+t\sigma\sqrt{\dfrac{1}{n}(1-\dfrac{n}{N}})$
где а -выборочное среднее, $\sigma$ -корень из выборочной дисперсии, n- объем выборки,N- объем генеральной совокупности(в условии задано их отношение), t=2 для вероятности 0,954 (вероятности для t=1,2,3 им в лекциях диктуют)Я считаю что в знаменателе n-1 вместо n, но им так грубо дают.

3.Решить неравенство что радиус указанного интервала меньше 5

4.Доверительный интервал для доли
$(\nu-t\sqrt{\dfrac{\nu(1-\nu)}{n}(1-\dfrac{n}{N}},\nu+t\sqrt{\dfrac{\nu(1-\nu)}{n}(1-\dfrac{n}{N}})$

5.Еще один вопрос Вы не задали- про моду.Видел лекцию где рекомендовалось так: Пусть на трех подряд стоящих интервалах видим значения а,В(наибольшее по гистограмме),с. Тогда разбиваем интервал, на котором В, в отношении с:а.Точка деления и будет выборочной модой. Я не согласен, например при 1,100,0 будет левый конец интервала. Предлагаю разбивать в отношении с+В:а+В.

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение02.08.2009, 21:10 


27/03/09
213
nn910 в сообщении #232471 писал(а):
здесь крайние "характерные значения" 22,5 и 82,5

Почему именно эти числа?

nn910 в сообщении #232471 писал(а):
Пусть на трех подряд стоящих интервалах видим значения а,В(наибольшее по гистограмме),с

это любые значения на интервалах или серединные. И интервал берется весь или именно связанный с наибольшим B?

nn910 в сообщении #232471 писал(а):
Видел лекцию

А где бы на эти лекции взглянуть?

Спасибо!

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение03.08.2009, 09:15 


25/05/09
231
NatNiM в сообщении #232540 писал(а):
nn910 в сообщении #232471 писал(а):
здесь крайние "характерные значения" 22,5 и 82,5

Почему именно эти числа?

Вот у Вас есть сколько-то данных выборки попавших в интервал (30,45]. Вы не знаете их точные значения и для наименьшей ошибки подсчета среднего присваиваете им всем 37,5. Я Вам сообщил,что (в предположении разумности составителя таблиц) интервалы (0,15) и (>90) пусты. Значит можно и у крайних непустых интервалов (15,30) и (75,90) взять их середины.
NatNiM в сообщении #232540 писал(а):
nn910 в сообщении #232471 писал(а):
Пусть на трех подряд стоящих интервалах видим значения а,В(наибольшее по гистограмме),с

это любые значения на интервалах или серединные. И интервал берется весь или именно связанный с наибольшим B?
/снял необщепринятую формулу/ Это тоже не идеальная оценка моды, но точнее чем у них давали. Когда мне пришлось, делая студ.работу,между ними выбирать,я округлил до 2 знач.цифр ответ и не вдавался в дискуссии. Проскочило.
Конспект конечно вернул. Вообще это все намного дальше от математики, чем матстатистика.Видите, сколько участников игнорируют тему.

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение03.08.2009, 18:01 
Аватара пользователя


21/01/09
3925
Дивногорск
Мода определяется по формуле: $Mo=x_{m-1}+(f_m-f_{m-1})(x_m-x_{m-1})/(2f_m-f_{m-1}-f_{m+1})$
$(x_{m-1}, x_m)$ - модальный интервал;
$f_{m-1}, f_m, f_{m+1}$ - эмпирическая плотность в интервале, предшествующем модальному, модальном и следующим за модальным соответственно.

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение04.08.2009, 09:58 


25/05/09
231
Александрович в сообщении #232683 писал(а):
Мода определяется по формуле: $Mo=x_{m-1}+(f_m-f_{m-1})(x_m-x_{m-1})/(2f_m-f_{m-1}-f_{m+1})$
$(x_{m-1}, x_m)$ - модальный интервал;
$f_{m-1}, f_m, f_{m+1}$ - эмпирическая плотность в интервале, предшествующем модальному, модальном и следующим за модальным соответственно.
Признаю что неправ и именно эта формула в книгах, а студент на которго я ссылался-неправильно списал. Сразу взялся считать насколько же я отклонился. Оказалось,максимум 3% длины модального интервала(0,45 дня).Ну и конечно у Александрович интервалы равны, а эмпирическая плотность пропорциональна числу значений выборки $N_m$ ,попавших в интервал,и можно так переписать для Excel:
$Mo=x_{m-1}+(N_m-N_{m-1})(x_m-x_{m-1})/(2N_m-N_{m-1}-N_{m+1})$

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение04.08.2009, 14:23 


27/03/09
213
Да, вижу, что активность по данной зададе минимальна. Спасибо Вам за участие и помощь!
Задачу решила за исключением, п.3:
С вероятностью 0,954 определите необходимую численность выборки при определении
среднего срока кредита, чтобы не ошибиться более чем на 5 дней.
Выборочную дисперсию нашла в Т.М. Сизова Статистика,
math/064a9ed489c71d2563f825468f4cc37282.gif
, где math/ad7e6bd6579122cbd1b13e36ce1aa5c082.gif - середины интервалов, это же и будет выборочной дисперсией. Хотя была книга, где выборочную вычисляли более громоздко с поправкой на середину интервала и ширину интервала.
Вообщем, получилось, что выборка должна быть не более 63.
math/7dc954484bef5a310f769b0a3cc4428282.gif
Мне кажется, что я ошиблась в знаке равенства, т.к. чем больше выборка, тем она точнее, так ведь?

Моду нашла так:
math/4f935fcb13ea3840980923316d9d39a682.gif
, где math/7ddede65285dbd166f04d85299f9ffc082.gif
- нижняя граница модального интервала,
math/c96a3d23ecbdaec0713fc91a90fbdd0182.gif
- ширина модального интервала,
math/c624cfabe5175242633beeb77165d7c282.gif
- соответственно частоты модального, предмодального и постмодального интервалов.
Еще моду можно определить графически по по гистограмме распределения. Для нахождения моды в интервальном ряду правую вершину модального прямоугольника нужно соединить с правым верхним углом предыдущего прямоугольника, а левую вершину – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.
Дело в том, что значения, найденные этими двумя способами отличаются. Проверю Вашим спосо-бом.





Ну и еще допишу...проверила, получается, что в моей формуле опечатка
$\[
M_0  = x_{M_0 }^  + a_{M_0 }  \cdot \frac{{n_{M_0 }  - n_{M_0  - 1} }}{{\left( {n_{M_0 }  - n_{M_0  - 1} } \right) + \left( {n_{M_0 }  + n_{M_0  + 1} } \right)}}
\]
$, а должно быть
$\[
M_0  = x_{M_0 }^  + a_{M_0 }  \cdot \frac{{n_{M_0 }  - n_{M_0  - 1} }}{{\left( {n_{M_0 }  - n_{M_0  - 1} } \right) + \left( {n_{M_0 }  - n_{M_0  + 1} } \right)}}
\]$
В учебнике общая формула дана в виде (1), а расчет в виде (2)....проверю по графику...возможно и в вычислении медианы опечатка :o

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение04.08.2009, 14:51 
Заслуженный участник
Аватара пользователя


30/01/09
7068
NatNiIM. А Ваша третья задача не совсем тривиальна. Дело в том, что закон распределения выборки неизвестен. И если применить какое-то общее неравенство, расчитаное на произвольное распределение (типа неравенства Чебышёва), то можно получить завышенную оценку.

-- Вт авг 04, 2009 15:55:21 --

А Архипов уже писал про трудности в третьей задаче.

-- Вт авг 04, 2009 16:05:12 --

Для решения третьей задачи нужны дополнительные предположения, например, что максимальный по длительности кредит ограничен каким-то сроком, например, 90 дней.

 Профиль  
                  
 
 Re: Задача по статистике
Сообщение04.08.2009, 15:05 


27/03/09
213
Ну, если границы "закрыть", можно решить, если это будет называеться решением...

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 22 ]  На страницу 1, 2  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group