2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Точность и размер выборки
Сообщение06.12.2018, 19:01 


04/04/09
10
Допустим, нас интересует средний рост человека возраста $X$. Поскольку выборка из таких людей у нас оказалась невелика, мы можем расширить диапазон возрастов (например, $X \pm  2$ года). Т.е. ослабляем критерий отбора (это уменьшает точность оценки), но увеличиваем объем выборки (повышается надёжность нашей оценки).

Насколько целесообразно увеличивать объем выборки за счет ослабления критериев ее формирования?

Подскажите, пожалуйста, что можно загуглить/почитать на эту тему.
Может есть какой-то термин, который обозначает эту "проблему"?

 Профиль  
                  
 
 Re: Точность и размер выборки
Сообщение07.12.2018, 15:35 


11/07/16
81
Такими вопросами занимается отдельная наука — метрология. Учет погрешностей и их сравнение как раз критически важно для измерения. Если Вы рассматриваете людей среднего (25-35) возраста $X$, то смело пренебрегайте парой лет. Если же подростков пубертатного возраста, то такая манипуляция приведет к критическим погрешностям >10%. Но каждый случай нужно рассматривать отдельно.

 Профиль  
                  
 
 Re: Точность и размер выборки
Сообщение10.12.2018, 01:10 


04/04/09
10
Astroid в сообщении #1359553 писал(а):
Такими вопросами занимается отдельная наука — метрология.

Не понимаю, при чем тут метрология. Здесь же нет задачи измерения физических величин. Тут задача обработки статистических данных. Наука - мат. статистика.

Astroid в сообщении #1359553 писал(а):
Если Вы рассматриваете людей среднего (25-35) возраста...

Конкретная задача была приведена для примера. Но меня интересует не конкретная задача, а теоретические основы описанной "проблемы".
Вот альтернативный пример, чтобы Вы не думали о каком-то "учете погрешностей", о котором в исходном посте не было ни слова :)

Есть конкретное офисное кресло.
Вопрос: какова средняя рыночная цена аналога (аналогичного кресла)?

У каждого кресла есть свои параметры. У "нашего" кресла параметры такие:
- определенный производитель,
- есть регулировка по высоте,
- есть система качания,
- есть регулировка подголовника,
- нет регулировки подлокотников,
- обивка - ткань,
- металлическое пятилучье.

Отбираем кресла с учетом всех параметров. Выясняется, что таких кресел очень мало. Для повышения надежности и достоверности нашей оценки (средней цены) нужно увеличить объем выборки. Мы принимаем решение ослабить критерий фильтрации:
- начинаем рассматривать кресла с пластиковым пятилучьем,
- добавляем кресла с регулировкой подлокотников,
- добавляем кресла других производителей.

Меня интересует название такой статистической "проблемы" или, можно сказать, "дилеммы". Хотелось бы что-то найти и почитать на эту тему.

 Профиль  
                  
 
 Re: Точность и размер выборки
Сообщение10.12.2018, 06:33 
Аватара пользователя


21/01/09
3925
Дивногорск
Cage, я бы сначала взял всю выборку и исключил из неё выбросы.

 Профиль  
                  
 
 Re: Точность и размер выборки
Сообщение10.12.2018, 06:42 
Заслуженный участник
Аватара пользователя


23/11/06
4171
В ситуации, когда "вся" выборка гораздо больше, чем исходная, именно элементы исходной выборки рискуют оказаться выбросами.

 Профиль  
                  
 
 Re: Точность и размер выборки
Сообщение10.12.2018, 07:44 
Аватара пользователя


21/01/09
3925
Дивногорск
Чтобы этого не случилось центр распределения следует взять от исходной выборки.

 Профиль  
                  
 
 Re: Точность и размер выборки
Сообщение10.12.2018, 08:38 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Краткий ответ практика - а фиг его знает (проверил и исправил цензор Нематюкайченко).
Подробный ответ практика будет в одесском стиле - вопросом на вопрос. А как те критерии, которые Вы взяли для формирования исходной выборки, могут повлиять на ценуоцениваемый параметр? И если есть основания думать, что никак - то эти критерии можно убрать, увеличивая выборку. А если влияют - то нельзя. Вот, скажем, производитель. У Вас стоял первоначально какой-нибудь изготовитель кресел офисного класса. В случае отказа от использования фирмы-производителя, как критерия отбора в выборку, в неё может попасть и какой-нибудь Noname или вообще Abibas, очень низкой цены и соответствующего качества, и производитель "премиального сегмента", где платят за марку, хвастаясь "А я купил такой же, но на десять штук баксов дороже". Соответственно у Вас может быть и резкое занижение цены, при том, что цены на продукт нужного Вам качестве существенно выше средних по выборке, и выброс в сторону увеличения. При этом формальные методы тут малоэффективны, нужен содержательный анализ - "влияет ли?".
Некоторую пользу может принести регрессионный анализ, сомнительные критерии будут генерировать искусственные переменные (металлическое пятилучье =0, пластиковое=1; а для $n$ производителей будет $n-1$ переменная, скажем, для изначально выбранного все нули, а для дополнительных соответствующая переменная=1, аналогично материал обивки и пр.) Однако для получения оценки выборку придётся ещё более увеличить, так что может оказаться, что пользы нет.

 Профиль  
                  
 
 Re: Точность и размер выборки
Сообщение10.12.2018, 19:32 


11/07/16
81
Cage
Я кажется понял, что вы хотите. Попробуйте изучить задачу оптимизации в общем смысле и применить численные методы, если потребуется. Тут без метрологии.

 Профиль  
                  
 
 Re: Точность и размер выборки
Сообщение11.12.2018, 09:49 
Аватара пользователя


07/03/16

3167
Cage в сообщении #1360118 писал(а):
Вопрос: какова средняя рыночная цена аналога (аналогичного кресла)?

Из докладной завморга главврачу: "Средняя температура пациентов по больнице остается слишком высокой, поэтому прошу рассмотреть вопрос приобретения еще одного морозильника".
Ответ Сары: "А мы покупаем или продаем?"
Ответ Дизраэли: "There are three kinds of lies: lies, damned lies, and statistics".

Общего ответа не получается. Конкретная задача требует конкретного решения. В приведенной задаче неясно ваше желание - входите вы в рынок как продавец или как производитель - список вопросов противоречив. Да и сам вопрос слишком академичен. Для утилитарных целей оценивают не только стоимость товара, но и его продаваемость, то есть максимизируют показатель прибыли.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 9 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group