2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Тестирование различий двух выборок. Квантили
Сообщение12.09.2024, 19:49 


15/12/19
2
Добрый день!

Имеется две больших независимых выборки. Для сравнения их между собой я делю наблюдения в каждой из них на N бакетов случайным образом, внутри каждого бакета считаю перцентили.
Теперь у меня есть две новых выборки, в каждой из которых по N наблюдений.
Получается, теперь я сравниваю группу А с N наблюдениями (где каждое наблюдение - перцентиль по бакету) и группу B с N наблюдениями. Для сравнения используется t-test.

Сравнение показало, что для 50 и 95 процентилей между выборками есть различие (p-value < 0.05). Однако для тех же данных для 75 перцентиля значимого различия между выборками не нашлось. Как так могло получиться? Возможно ли такое в принципе, или нужно искать ошибки в данных?

 Профиль  
                  
 
 Re: Тестирование различий двух выборок. Квантили
Сообщение12.09.2024, 19:57 
Админ форума


02/02/19
2625
 i  adtsvetkov
Даже отдельные обозначения нужно оформлять как формулы. Не "N наблюдений", а "$N$ наблюдений". Краткие инструкции: «Краткий FAQ по тегу [math]» и видеоролик Как записывать формулы.

 Профиль  
                  
 
 Re: Тестирование различий двух выборок. Квантили
Сообщение02.10.2024, 10:42 
Заслуженный участник
Аватара пользователя


11/03/08
9967
Москва
Прошу прощения за поздний ответ, но ситуация вполне возможная. Пусть распределения в выборках различны, но пусть для некоторого a $F_1(a)=0.75$ и $F_2(a)=0.75$. Например, первое распределение равномерное, $F_1=U(0;1600)$, и второе тоже равномерное, $F_2=U(900;1300)$
50% квантили будут колебаться около 800 и 1100 соответственно, 95% будут несколько меньшими 1600 и 1300 (примерно 1520 и 1235), но 75% окажутся близки к 1200 оба.
Вообще же Ваш тест вызывает некоторое недоумение. Если Вам доступны все наблюдения, зачем вводить такое случайное разбиение, если, по сути, Вы обрабатываете все значения? Не проще ли работать со всей выборкой?
Да и Стьюдент несколько странен - если ожидать приблизительной нормальности от 50% перцентиля можно, то 95%, скорее всего, будет иметь сильно асимметричное распределение.

 Профиль  
                  
 
 Re: Тестирование различий двух выборок. Квантили
Сообщение06.10.2024, 12:28 


24/01/09
1291
Украина, Днепр
Евгений Машеров в сообщении #1657064 писал(а):
Если Вам доступны все наблюдения, зачем вводить такое случайное разбиение


Может выборки временные?

 Профиль  
                  
 
 Re: Тестирование различий двух выборок. Квантили
Сообщение06.10.2024, 12:49 
Заслуженный участник
Аватара пользователя


11/03/08
9967
Москва
Но сказано: "случайным образом"...

 Профиль  
                  
 
 Re: Тестирование различий двух выборок. Квантили
Сообщение06.10.2024, 13:09 


24/01/09
1291
Украина, Днепр
А, пардон. Тогда непонятно. И в первую очередь - откуда те "новые выборки"

ps:
а вообще, вспомнилась довольно любопытная задачка по схожему поводу.

 Профиль  
                  
 
 Re: Тестирование различий двух выборок. Квантили
Сообщение06.10.2024, 19:40 
Заслуженный участник
Аватара пользователя


11/03/08
9967
Москва
Прежде всего непонятно, для чего такая изощрённая схема. Потом уже частные вопросы, насколько обоснованы сравнения по Стьюденту, в частности, точно ли распределение квантилей достаточно близко к нормальному и что делать с неравенством дисперсий.
Ну, если "задачка любопытна" - не возражал бы с нею познакомиться.

 Профиль  
                  
 
 Re: Тестирование различий двух выборок. Квантили
Сообщение07.10.2024, 21:51 


24/01/09
1291
Украина, Днепр
Евгений Машеров в сообщении #1657650 писал(а):
Ну, если "задачка любопытна" - не возражал бы с нею познакомиться.


Задачка вполне жизненная.
Есть счётчик Гейгера, выдающий рандомные импульсы пропорционально полю радиации.

Так как импульсы случайны, с пуассоновой плотностью за время $\Delta t$, то результат измерений за некоторое время имеет ошибку. Щелчки вполне могут идти то чаще, то реже.
Так что, при измерении в неизменном поле для бОльшей точности желательно поизмерять подольше.

С другой стороны, если поле меняется, или мы двигаемся, то желательно как можно скорее диагностировать изменение экспозиции.

Вопрос - как построить алгоритм измерения, в некотором смысле обеспечивающий наилучшую точность в постоянных полях, и наибыстрейшее определение факта изменения интенсивности облучения.

 Профиль  
                  
 
 Re: Тестирование различий двух выборок. Квантили
Сообщение08.10.2024, 09:45 
Заслуженный участник
Аватара пользователя


11/03/08
9967
Москва
Она ещё более жизненная, чем Вы полагаете. Это типичнейшая проблема обработки биомедицинской информации. Живой организм меняет своё состояние. И увеличивая экспозицию, мы меряем величину, не имеющую определённого значения, а дрейфующую. По идее, надо искать минимум среднеквадратичного отклонения, как сумму дисперсии и квадрата смещения.

 Профиль  
                  
 
 Re: Тестирование различий двух выборок. Квантили
Сообщение13.10.2024, 20:34 


24/01/09
1291
Украина, Днепр
Евгений Машеров: ну, там-то хотя бы есть некая величина. А тут эти дельта-функции. Что с ними делать?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 10 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group