2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




На страницу 1, 2  След.
 
 Задача по статистике
Сообщение30.07.2009, 14:22 
Для определения сроков пользования краткосрочным кредитом в коммерческом банке города была проведена 5% случайная бесповторная выборка лицевых счетов, в результате которой получено следующее распределение клиентов по сроку пользования кредитом:
Срок пользования кредитом (дней) Число вкладчиков (чел.)
До 30 60
30 – 45 40
45 – 60 120
60 – 75 80
Свыше 75 50

1. По данным таблицы постройте не менее трёх видов статистических графиков, возможных для этого исследования.
2. Вычислите:
численность генеральной совокупности,
средний срок пользования кредитом,
моду и медиану данного ряда распределения
дисперсию выборки.

3. С вероятностью 0,954 определите необходимую численность выборки при определении среднего срока кредита, чтобы не ошибиться более чем на 5 дней.
4. Определите долю вкладчиков в банке со сроком кредита свыше 60 дней. Определите с вероятностью 0,954, в каких пределах находится число таких клиентов.

Подсткажите, пожалуйста, какую литературу взять для решения этой задачи? Где будут все эти понятия?
Спасибо.

 
 
 
 Re: Задача по статистике
Сообщение30.07.2009, 23:11 
Задание составлено не очень аккуратно. Много неопределенностей.

 
 
 
 Re: Задача по статистике
Сообщение31.07.2009, 07:39 
Архипов в сообщении #232135 писал(а):
Задание составлено не очень аккуратно. Много неопределенностей.


А что именно составляет неопределенность?

 
 
 
 Re: Задача по статистике
Сообщение31.07.2009, 10:52 
NatNiM в сообщении #232023 писал(а):

Подсткажите, пожалуйста, какую литературу взять для решения этой задачи? Где будут все эти понятия?
Спасибо.
Я решал много таких.Нижеупомянутые книги читать не пришлось, но если найдете:

«Эконометрика – это не то же самое, что экономическая статистика. Она не идентична и тому, что мы называем экономической теорией, хотя значительная часть этой теории носит количественный характер. Эконометрика не является синонимом приложений математики к экономике. Как показывает опыт, каждая из трех отправных точек – статистика, экономическая теория и математика – необходимое, но не достаточное условие для понимания количественных соотношений в современной экономической жизни. Это единство всех трех составляющих. И это единство образует эконометрику.» – Frisch R. Editorial. Econometrica. – 1933. – № 1. – P. 2.



При решении задач используется следующая литература:

1. Эконометрика: Учебник / Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2006. – 576 с.

2. Практикум по эконометрике: Учеб. пособие / Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2006. – 344 с.

3. Эконометрика: Учебно-методическое пособие / Шалабанов А.К., Роганов Д.А. – Казань: Издательский центр Академии управления «ТИСБИ», 2004. – 198 с.

4. Доугерти К. Введение в эконометрику: Пер. с англ. – М.: ИНФРА-М, 1999. – 402 с.

5. Кремер Н.Ш., Путко Б.А. Эконометрика: Учебник для вузов / Под ред. проф. Н.Ш. Кремера. – М.: ЮНИТИ-ДАНА, 2002. – 311 с.

6. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс: Учебник. – М.: Дело, 2001. – 400 с.

7. Катышев П.К., Магнус Я.Р., Пересецкий А.А. Сборник задач к начальному курсу эконометрики. – М.: Дело, 2002. – 208 с.

8. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2-х т. – Т. 1. Айвазян С.А., Мхитарян В.С. Теория вероятностей и прикладная статистика. – М: ЮНИТИ-ДАНА, 2001. – 656 с.

9. Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2-х т. – Т. 2. Айвазян С.А. Основы эконометрики. – М: ЮНИТИ-ДАНА, 2001. – 432 с.

10. Эконометрика: Учебник / Тихомиров Н.П., Дорохина Е.Ю. – М.: Издательство «Экзамен», 2003. – 512 с. (Программа курса, Учебник: часть 1, часть 2, часть 3, часть 4)

11. Сборник задач по эконометрике: Учебное пособие для студентов экономических вузов / Сост. Е.Ю. Дорохина, Л.Ф. Преснякова, Н.П. Тихомиров. - М.: Издательство «Экзамен», 2003. - 224 с.

12. Эконометрика: Учеб. пособие для вузов / А.И. Орлов – М.: Издательство «Экзамен», 2002. – 576 с.

13. Кулинич Е.И. Эконометрия. – М.: Финансы и статистика, 2001.– 304 с.

14. Мардас А.Н. Эконометрика. – СПб: Питер, 2001. – 144 с
Источник: http://reshebnik.ru Но у них дороже раза в 3. Кстати на мой взгляд неточен только 1 пункт. Возможно преп считает,что гистограмма и круговая диаграмма от Excel- разные хотя по сути одно и то же

 
 
 
 Re: Задача по статистике
Сообщение31.07.2009, 12:30 
Спасибо! Первые 2 книги у меня есть, уже читаю

 
 
 
 Re: Задача по статистике
Сообщение01.08.2009, 21:24 
Появились вопросы.
1. Графики подходят только гисторамма частот и гистограмма относительных частот, хотя как быть с неравными интервалами и не закрытыми левой и правой границей (<30 и >75)?
2. Не могу понять, как вычислить средний срок пользования кредитом, не имея значения вероятности, с которой необходимо установить это значение.
3. Не ясно, какую формулу использовать, имея данные "чтобы не ошибиться не более чем на 5 дней".

Спасибо.

 
 
 
 Re: Задача по статистике
Сообщение01.08.2009, 23:19 
1) С гистограммами проблем нет, просто в области аргумента записать "менее 30", "более 75".
2) А для вычисления среднего значения срока , действительно, возникает трудность, о чем уже говорилось. С "менее 30" еще можно выкрутиться, так как минимальный срок можно установить в 1 сутки, но "более 75" не имеет предела.
3) Если не устранить неопределенности, о чем говорится в пункте 2), то дальнейшие выкладки бесполезны.

 
 
 
 Re: Задача по статистике
Сообщение02.08.2009, 10:19 
NatNiM в сообщении #232427 писал(а):
Появились вопросы.
1. Графики подходят только гисторамма частот и гистограмма относительных частот, хотя как быть с неравными интервалами и не закрытыми левой и правой границей (<30 и >75)?
2. Не могу понять, как вычислить средний срок пользования кредитом, не имея значения вероятности, с которой необходимо установить это значение.
3. Не ясно, какую формулу использовать, имея данные "чтобы не ошибиться не более чем на 5 дней".

Спасибо.
Первый раз (год назад) и у меня они возникали. Пришлось проглядеть их лекционные курсы. (Книгу-первоисточник так и не выяснил.Но она явно одна и та же для этого раздела курса -условно"Выборочный анализ"- не менее чем в трех вузах).Вот что запомнил.
1.Характерные значения на каждом интервале, по возможности, надо выбирать равноудаленными друг от друга, здесь крайние "характерные значения" 22,5 и 82,5.Их и использовать для подсчета среднего. Мотивировка(моя): людей, которые готовят эти таблицы, тоже чему-то учат, в тч что интервалы группировки надо выбирать равные.(Правда есть условие Стерджесса на количество интервалов :не более 1+$\log_2{N}$ но здесь-то оно выполняется с запасом).Поэтому если бы имелся в выборке хоть один кредит сроком <15, он был бы отражен в таблице.Тем самым эта строка таблицы дает две информации:от 15 до 30 указано, <15 ни одного.Аналогично по верхней границе.
Третью статистическую таблицу(если уж нет возможности посмотреть у бедняги текст лекций) я бы взял ступенчатый вид функции распределения (растущей от 0 до1) -по нему хорошо видна медиана.Мне эта проблема не встречалась.

2.Доверительный интервал для среднего
$(a-t\sigma\sqrt{\dfrac{1}{n}(1-\dfrac{n}{N}},a+t\sigma\sqrt{\dfrac{1}{n}(1-\dfrac{n}{N}})$
где а -выборочное среднее, $\sigma$ -корень из выборочной дисперсии, n- объем выборки,N- объем генеральной совокупности(в условии задано их отношение), t=2 для вероятности 0,954 (вероятности для t=1,2,3 им в лекциях диктуют)Я считаю что в знаменателе n-1 вместо n, но им так грубо дают.

3.Решить неравенство что радиус указанного интервала меньше 5

4.Доверительный интервал для доли
$(\nu-t\sqrt{\dfrac{\nu(1-\nu)}{n}(1-\dfrac{n}{N}},\nu+t\sqrt{\dfrac{\nu(1-\nu)}{n}(1-\dfrac{n}{N}})$

5.Еще один вопрос Вы не задали- про моду.Видел лекцию где рекомендовалось так: Пусть на трех подряд стоящих интервалах видим значения а,В(наибольшее по гистограмме),с. Тогда разбиваем интервал, на котором В, в отношении с:а.Точка деления и будет выборочной модой. Я не согласен, например при 1,100,0 будет левый конец интервала. Предлагаю разбивать в отношении с+В:а+В.

 
 
 
 Re: Задача по статистике
Сообщение02.08.2009, 21:10 
nn910 в сообщении #232471 писал(а):
здесь крайние "характерные значения" 22,5 и 82,5

Почему именно эти числа?

nn910 в сообщении #232471 писал(а):
Пусть на трех подряд стоящих интервалах видим значения а,В(наибольшее по гистограмме),с

это любые значения на интервалах или серединные. И интервал берется весь или именно связанный с наибольшим B?

nn910 в сообщении #232471 писал(а):
Видел лекцию

А где бы на эти лекции взглянуть?

Спасибо!

 
 
 
 Re: Задача по статистике
Сообщение03.08.2009, 09:15 
NatNiM в сообщении #232540 писал(а):
nn910 в сообщении #232471 писал(а):
здесь крайние "характерные значения" 22,5 и 82,5

Почему именно эти числа?

Вот у Вас есть сколько-то данных выборки попавших в интервал (30,45]. Вы не знаете их точные значения и для наименьшей ошибки подсчета среднего присваиваете им всем 37,5. Я Вам сообщил,что (в предположении разумности составителя таблиц) интервалы (0,15) и (>90) пусты. Значит можно и у крайних непустых интервалов (15,30) и (75,90) взять их середины.
NatNiM в сообщении #232540 писал(а):
nn910 в сообщении #232471 писал(а):
Пусть на трех подряд стоящих интервалах видим значения а,В(наибольшее по гистограмме),с

это любые значения на интервалах или серединные. И интервал берется весь или именно связанный с наибольшим B?
/снял необщепринятую формулу/ Это тоже не идеальная оценка моды, но точнее чем у них давали. Когда мне пришлось, делая студ.работу,между ними выбирать,я округлил до 2 знач.цифр ответ и не вдавался в дискуссии. Проскочило.
Конспект конечно вернул. Вообще это все намного дальше от математики, чем матстатистика.Видите, сколько участников игнорируют тему.

 
 
 
 Re: Задача по статистике
Сообщение03.08.2009, 18:01 
Аватара пользователя
Мода определяется по формуле: $Mo=x_{m-1}+(f_m-f_{m-1})(x_m-x_{m-1})/(2f_m-f_{m-1}-f_{m+1})$
$(x_{m-1}, x_m)$ - модальный интервал;
$f_{m-1}, f_m, f_{m+1}$ - эмпирическая плотность в интервале, предшествующем модальному, модальном и следующим за модальным соответственно.

 
 
 
 Re: Задача по статистике
Сообщение04.08.2009, 09:58 
Александрович в сообщении #232683 писал(а):
Мода определяется по формуле: $Mo=x_{m-1}+(f_m-f_{m-1})(x_m-x_{m-1})/(2f_m-f_{m-1}-f_{m+1})$
$(x_{m-1}, x_m)$ - модальный интервал;
$f_{m-1}, f_m, f_{m+1}$ - эмпирическая плотность в интервале, предшествующем модальному, модальном и следующим за модальным соответственно.
Признаю что неправ и именно эта формула в книгах, а студент на которго я ссылался-неправильно списал. Сразу взялся считать насколько же я отклонился. Оказалось,максимум 3% длины модального интервала(0,45 дня).Ну и конечно у Александрович интервалы равны, а эмпирическая плотность пропорциональна числу значений выборки $N_m$ ,попавших в интервал,и можно так переписать для Excel:
$Mo=x_{m-1}+(N_m-N_{m-1})(x_m-x_{m-1})/(2N_m-N_{m-1}-N_{m+1})$

 
 
 
 Re: Задача по статистике
Сообщение04.08.2009, 14:23 
Да, вижу, что активность по данной зададе минимальна. Спасибо Вам за участие и помощь!
Задачу решила за исключением, п.3:
С вероятностью 0,954 определите необходимую численность выборки при определении
среднего срока кредита, чтобы не ошибиться более чем на 5 дней.
Выборочную дисперсию нашла в Т.М. Сизова Статистика,
math/064a9ed489c71d2563f825468f4cc37282.gif
, где math/ad7e6bd6579122cbd1b13e36ce1aa5c082.gif - середины интервалов, это же и будет выборочной дисперсией. Хотя была книга, где выборочную вычисляли более громоздко с поправкой на середину интервала и ширину интервала.
Вообщем, получилось, что выборка должна быть не более 63.
math/7dc954484bef5a310f769b0a3cc4428282.gif
Мне кажется, что я ошиблась в знаке равенства, т.к. чем больше выборка, тем она точнее, так ведь?

Моду нашла так:
math/4f935fcb13ea3840980923316d9d39a682.gif
, где math/7ddede65285dbd166f04d85299f9ffc082.gif
- нижняя граница модального интервала,
math/c96a3d23ecbdaec0713fc91a90fbdd0182.gif
- ширина модального интервала,
math/c624cfabe5175242633beeb77165d7c282.gif
- соответственно частоты модального, предмодального и постмодального интервалов.
Еще моду можно определить графически по по гистограмме распределения. Для нахождения моды в интервальном ряду правую вершину модального прямоугольника нужно соединить с правым верхним углом предыдущего прямоугольника, а левую вершину – с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.
Дело в том, что значения, найденные этими двумя способами отличаются. Проверю Вашим спосо-бом.





Ну и еще допишу...проверила, получается, что в моей формуле опечатка
$\[
M_0  = x_{M_0 }^  + a_{M_0 }  \cdot \frac{{n_{M_0 }  - n_{M_0  - 1} }}{{\left( {n_{M_0 }  - n_{M_0  - 1} } \right) + \left( {n_{M_0 }  + n_{M_0  + 1} } \right)}}
\]
$, а должно быть
$\[
M_0  = x_{M_0 }^  + a_{M_0 }  \cdot \frac{{n_{M_0 }  - n_{M_0  - 1} }}{{\left( {n_{M_0 }  - n_{M_0  - 1} } \right) + \left( {n_{M_0 }  - n_{M_0  + 1} } \right)}}
\]$
В учебнике общая формула дана в виде (1), а расчет в виде (2)....проверю по графику...возможно и в вычислении медианы опечатка :o

 
 
 
 Re: Задача по статистике
Сообщение04.08.2009, 14:51 
Аватара пользователя
NatNiIM. А Ваша третья задача не совсем тривиальна. Дело в том, что закон распределения выборки неизвестен. И если применить какое-то общее неравенство, расчитаное на произвольное распределение (типа неравенства Чебышёва), то можно получить завышенную оценку.

-- Вт авг 04, 2009 15:55:21 --

А Архипов уже писал про трудности в третьей задаче.

-- Вт авг 04, 2009 16:05:12 --

Для решения третьей задачи нужны дополнительные предположения, например, что максимальный по длительности кредит ограничен каким-то сроком, например, 90 дней.

 
 
 
 Re: Задача по статистике
Сообщение04.08.2009, 15:05 
Ну, если границы "закрыть", можно решить, если это будет называеться решением...

 
 
 [ Сообщений: 22 ]  На страницу 1, 2  След.


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group