2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 размер псевдовыборки для bootstrap
Сообщение06.08.2018, 22:51 


07/10/15

2400
При практической использовании метода bootstrap возникает вопрос выбора оптимального размера bootstrap псевдовыборки. Оказалось, что этому вопросу уделяется незаслуженно мало внимания, если уделяется вообще. Более - менее внятное рассмотрение данного вопроса удалось найти только здесь:
https://stats.stackexchange.com/questions/96739/what-is-the-632-rule-in-bootstrapping
из за трудностей с переводом, до конца не понял, что здесь имеется в виду, но смутные догадки наталкивают на мысль, что оптимальный размер bootstrap псевдовыборки составляет 63,2% от исходной выборки.

Почему так, непонятно. Так ли оно вообще - полной уверенности нет.
Чтобы хоть как то проверить, я провёл численный эксперимент на парных корреляциях, вовсех случаях N=1000, число репликаций M=1000,
для псевдовыборки k=999
Изображение
для псевдовыборки k=632
Изображение
для псевдовыборки k=100
Изображение

Получается, что для 63,2% результаты самые лучшие, но возможно - это просто случайное совпадение.

Есть ли вообще какие то обоснованные правила выбора размера псевдовыборки? и на что влияет этот размер?

 Профиль  
                  
 
 Re: размер псевдовыборки для bootstrap
Сообщение08.08.2018, 19:15 


07/04/15
244
$$1 - \frac{1}{e}$$

 Профиль  
                  
 
 Re: размер псевдовыборки для bootstrap
Сообщение08.08.2018, 22:34 


07/10/15

2400
Теперь понятно откуда это берётся.

 Профиль  
                  
 
 Re: размер псевдовыборки для bootstrap
Сообщение15.10.2018, 21:27 


07/10/15

2400
Долго изучал этот вопрос, но окончательного понимания так и нет.
Как я понял, размер псевдовыборки, получаемой из исходной - путём случайного отбора наблюдений с возвратом, традиционно берётся равным размеру исходной выборки. Просто, как само собой разумеется. Не могу понять, оптимальный ли это размер, или нет?

На счёт правила 632 - это немного не то. 632 - это вес bootstrap оценки в общей взвешенной оценки, а объёмы псевдовыборок, там так же берутся равными объёму оригинальной выборки.

Прошу помочь разобраться. На что вообще влияет объём псевдовыборки в bootstrap? Ведь технически его легко можно как увеличить, так и уменьшить.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 4 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: gris, Mikhail_K


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group