2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Сравнение выборок. Практическая задача.
Сообщение05.05.2012, 14:37 
Аватара пользователя
Пусть мы мониторим некое техническое устройство состоящее из 576 элементов. Мониторинг заключается в измерении (фиксации значения) некоторого параметра (температура, вибрация...) элементов в какие-то фиксированные моменты времени эксплуатации устройства. В эти моменты времени по выборке объёмом 64 из всего количества элементов измеряется требуемый параметр. Выборки между собой не связаны (каждый раз выбираются случайным образом разные элементы). Пусть за время эксплуатации устройства набрано несколько таких выборок, например 5. Проверяем гипотезу принадлежности двух выборок к одной генеральной совокупности (по критерию Смирнова). 1-ая и 2-ая не отвергает, 2-ая и 3-я тоже, ...
4-ая и 5-ая не отвергает. А вот 1-ая и 5-ая - отвергает. Какой можно из этого сделать вывод? Изменился ли параметр генеральной совокупности?

 
 
 
 Re: Сравнение выборок. Практическая задача.
Сообщение05.05.2012, 14:48 
Аватара пользователя
А какой у Вас пороговый уровень? Если он соответствует 95% вероятности, то значит в среднем в одном из 20 случаев он будет лажать и отвергать правильную гипотезу. Так что вроде всё в порядке.

 
 
 
 Re: Сравнение выборок. Практическая задача.
Сообщение05.05.2012, 15:50 
Аватара пользователя
worm2 в сообщении #567611 писал(а):
А какой у Вас пороговый уровень? Если он соответствует 95% вероятности, то значит в среднем в одном из 20 случаев он будет лажать и отвергать правильную гипотезу. Так что вроде всё в порядке.

В каком порядке? Параметр ГС не поменялся и мы продолжаем делать выборку из такой же конечной ГС?

 
 
 
 Re: Сравнение выборок. Практическая задача.
Сообщение05.05.2012, 15:56 
Александрович в сообщении #567607 писал(а):
Выборки между собой не связаны (каждый раз выбираются случайным образом разные элементы).

Не понял. Вообще не связаны, или всё-таки каждый раз "разные элементы"?

 
 
 
 Re: Сравнение выборок. Практическая задача.
Сообщение05.05.2012, 16:35 
Аватара пользователя
Теперь я не понял. Связанные выборки, это когда из ограниченной ГС выбираются каждый раз одни и те же элементы. В моём же случае элементы выбираются как Бог на душу послал, то есть случайно и по определению связанными быть не могут.

 
 
 
 Re: Сравнение выборок. Практическая задача.
Сообщение05.05.2012, 16:56 
Меня просто ввело в заблуждение Ваши слова "разные элементы". Теперь как я понял они не обязательно разные. То есть я хотел спросить, бесповторная ли выборка? Теперь понял что да.

 
 
 
 Re: Сравнение выборок. Практическая задача.
Сообщение05.05.2012, 17:22 
Аватара пользователя
longstreet в сообщении #567649 писал(а):
Теперь как я понял они не обязательно разные.

Вы правильно понимаете. Они не обязательно одни и те же, а всегда случайно разные.

 
 
 
 Re: Сравнение выборок. Практическая задача.
Сообщение05.05.2012, 17:46 

(Оффтоп)

Меня опять сбивает что Вы говорите "случайно разные". Не говорят так.
Необходимо и достаточно сказать "случайно". Добавляя же слово "разные" у меня складывается понимание, что выбираются-то они случайно, но обязательно каждый раз разные, другими словами, обязательно без повторений.

 
 
 
 Re: Сравнение выборок. Практическая задача.
Сообщение05.05.2012, 18:01 
Аватара пользователя
Конечно без повторений. Конечное число датчиков единожды случайным образом расставляются на элементах устройствах. Установка более чем одного датчика на элемент устройства элемент недопустимо.

 
 
 
 Re: Сравнение выборок. Практическая задача.
Сообщение06.05.2012, 18:02 
Аватара пользователя
Александрович в сообщении #567632 писал(а):
В каком порядке? Параметр ГС не поменялся и мы продолжаем делать выборку из такой же конечной ГС?

Это (или отрицание этого) можно утверждать с какой-то вероятностью. Предположение об однородности может выглядеть правдоподобным для всех выборок, несмотря на то, что критерий Смирнова для некоторых говорит иное.

Ну вот, например, монета может выпасть орлом и решкой. Мы проверяем гипотезу, что монета однородна и вероятности орла и решки равны 1/2. Как бы мы её ни проверяли, есть вероятность ошибки 1-го рода: того, что так оно и есть, но наш тест скажет, что монета неоднородна и что-то выпадает чаще. И есть вероятность ошибки 2-го рода: того, что монета неоднородна, но наш тест недостаточно чувствителен, или звёзды так встанут, но тест не выявит неоднородности.
К примеру, наш тест — 10 независимых подбрасываний, и мы решаем, что если орлов выпало от 3 до 7, то монета однородна, иначе неоднородна. При этом может случиться так, что монета однородна, но выпадут меньше 3 орлов или меньше 3 решек. Вероятность этого (ошибки 1-го рода) будет около 10%. То есть если мы будем повторять этот тест ещё и ещё с той же самой монетой, то примерно в 10% случаев он будет давать сбой.

Тот же критерий Смирнова имеет таблицы, с которыми Вы сравниваете то, что получили в эксперименте. Таблицы зависят от уровня ошибки 1-го рода. По одной таблице (при одном уровне ошибки) Вы получите, что выборки из одной генеральной совокупности, по другой — что не из одной.
Либо Вы по значению, полученному в эксперименте, получаете уровень значимости, и если он больше какого-то заранее определённого порога, Вы принимаете гипотезу, если меньше — отвергаете.
Но принцип тот же: если Вы будете повторять Ваш тест, рано или поздно он ошибётся.

 
 
 [ Сообщений: 10 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group