vic_s |
корреляция в Statistica 21.02.2010, 11:50 |
|
14/02/10 2
|
Запутался в хелпе Statistica.
в Statistica делаю Statistics - Basic Statistic/Tables - Correlation Matrices там указываю две выборки (два массива) и Correlation Matrix. В итоге получаю матрицу значений. Как я понял это по Пирсону (либо хи-квадрат).
Однако, в мат. библиотеке к С++, которая на работе в примере вычисляется только один коэффициент корреляции по Пирсону. Матрицы там нет.
Что мне вывела Statistica (что за коэффициенты в матрице?) или это ошибка в документации к C++?
И еще вопрос для уточнения. Этот критерий Пирсона применяется только если известен закон распределения ? Если закон распределения неизвестен то непараметрическая статистика ?
Спасибо
|
|
|
|
|
TS |
Re: корреляция в Statistica 23.02.2010, 12:30 |
|
20/04/07 14
|
В Statistica вы указываете не две выборки, а два набора переменных (исходно выборка у вас одна, но в ней много признаков (=переменных=столбцов в матрице с данными). Получается матрица - корреляции каждого из выбранных признаков с каждым. Можно указать и один набор признаков - тогда получится их корреляционная матрица (эквивалентно тому, что вы выберете одинаковые наборы признаков в двух списках). Чтобы получить одно число, нужно выбрать два признака, по одному в каждом списке.
Да, это обычный коэффициент корреляции Пирсона, который измеряет линейную зависимость. Соответственно, применяется, если у вас между признаками зависимость близка к линейной и если нет ошибочных наблюдений (outliers). В остальных случаях применяется непараметрическая статистика. Непараметрические меры зависимости (Спирмена, Кендалла) измеряют монотонную зависимость для количественных признаков, пригодны для порядковых признаков (которые нельзя складывать, но можно сравнивать больше-меньше) и устойчивы к ошибкам в данных.
|
|
|
|
|
|
Страница 1 из 1
|
[ Сообщений: 2 ] |
|
Модераторы: Karan, Toucan, PAV, maxal, Супермодераторы