2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Дисперсионный/корелляционный анализ
Сообщение10.10.2014, 12:45 
Помогите разобраться с задачами.

1. При испытании на устойчивость к истиранию краски двух типов Тип1 и Тип2 измеряли потерю массы в граммах через определённый интервал времени, при чём известно, что устойчивость к истиранию краски Тип2 не меньше, чем краски Тип1. Краску каждого из двух типов наносили на 8 панелей. Получили результаты (таблица с 8 по 2 значений потери массы).
Можно ли на основании этих данных утверждать, что краски существенно различаются по устойчивости к истиранию?

Насколько я понимаю, здесь нужно просто вычислить коэффициент корреляции, но меня смущает выделенная оговорка. На что она влияет в процессе решения?

2. В таблицах приведены интервалы в днях между катастрофами на угольных шахтах с 1875 по 1900 гг и с 1901 по 1951 гг. (в первой таблице 55 интервалов, во второй - 54). Свидетельствуют ли эти данные о наличии существенных отличий между интервалами времени от катастрофы к катастрофе за эти 2 периода?

Здесь я собираюсь применить дисперсионный анализ. На википедии сказано, что *Исходными положениями дисперсионного анализа является нормальное распределение зависимой переменной* Нужно ли это каким-либо образом проверять? Спрашиваю потому что вот в этой видеолекции с похожей задачей
https://www.youtube.com/watch?v=ND4roLt ... gG&index=1
Бояршинов себя этим не утруждает.

 
 
 
 Re: Дисперсионный/корелляционный анализ
Сообщение10.10.2014, 14:14 
Аватара пользователя
1. Я бы предположил, что регрессии. И что нужно проверить значимость отличия разности коэффициентов от нуля. Причём критерий односторонний (что следует из того, что один вариант отсекается)
2. Ну, после построения остатки анализируют.

 
 
 
 Re: Дисперсионный/корелляционный анализ
Сообщение10.10.2014, 14:25 
xenich в сообщении #917184 писал(а):
меня смущает выделенная оговорка.

надо учесть, что данные о том что краска тип2 истирается сильнее тип1, заведомо неверные.
например, если какая-либо из панелей содержит сильно больше краски тип2 чем тип1, данные с этой панели просто не участвуют в расчетах.
я правда не очень понял корреляция чего с чем считается?

 
 
 
 Re: Дисперсионный/корелляционный анализ
Сообщение10.10.2014, 15:43 
хорошо, по первой задаче всё-таки приведу таблицу:

Потеря массы
Тип1___Тип2
17______19
10______17
19_____16
17_____12
33______35
20______25
22______23
28_____21

Если отбросить пары, в которых потеря массы краски 2 больше, чем первой, то останутся три выделенных значения. неужели по ним можно провести анализ?

Евгений Машеров в сообщении #917202 писал(а):
1. Я бы предположил, что регрессии.

Вы имеете ввиду, что нужно найти уравнение линейной зависимоти методом наименьших квадратов?
Не могли бы вы поподробнее объяснить в каких случаях применяется регрессионный, а в каких корреляционный анализ, потому что у меня ещё несколько задач и, честно говоря, я везде хотел находить коэффициент корреляции, но теперь вижу, что не всё так просто ))

 
 
 
 Re: Дисперсионный/корелляционный анализ
Сообщение10.10.2014, 15:57 
xenich в сообщении #917218 писал(а):
неужели по ним можно провести анализ?

а что может смущать?
например, когда взвешивается какое угодно вещество - это получение среднего всех весов в веществе.
если одно и тоже вещество ($8$ куб см стального порошка) взвешивается на $8$-ми весах по $1$ куб см на каждых и $5$-ть весов показывают $1; \quad 0,9; \quad 1,2; \quad 0,7; \quad 0,75 $ г, - это явно весы врут и вес порошка здесь ни причем.

 
 
 
 Re: Дисперсионный/корелляционный анализ
Сообщение11.10.2014, 10:47 
Аватара пользователя
Возможно, всё ещё проще. Всего лишь сравнить средние значения двух выборок. Стьюдентом, скажем. Может, и непараметрически, вообще "что делать" надо не здесь спрашивать, а у преподавателя, здесь владеющие математикой иногда встречаются, а телепатов точно нет. "Как сделать" тут могут объяснить, а "что" - надобно узнавать особо.
Если строки соответствуют измерениям, проводимым в одинаковых условиях (материал подложки, время экспозиции и т.п.), то возможно, что использовать надо критерии для зависимых выборок (только "возможно", я тоже не Вольф Мессинг, в реальных задачах добиться от экспериментатора, что ему нужно, часть работы важная и трудоёмкая, а тут надо указание от преподавателя или автора методички). Информация, что "одна краска более устойчива к истиранию" не должна использоваться для отбраковки части данных (хотя вообще могут быть ситуации, когда доступная априорная информация помогает обнаруживать грубые ошибки, скажем, когда выход вещества выше теоретически возможного - ошибка измерявшего лаборанта несравненно вероятнее прорыва в теории). Скорее можно ожидать, что интересна только одна возможность отклонения, другая несущественно отличается, с практической точки зрения, от отсутствия разницы (скажем, нам предлагают заменить покрытие на новое "более качественное", и мы примем решение, если получим статистически значимое превосходство нового над старым; ни отсутствие разницы, ни преимущество старого основанием для такой замены, разумеется, не будут).

 
 
 [ Сообщений: 6 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group