В Statistica вы указываете не две выборки, а два набора переменных (исходно выборка у вас одна, но в ней много признаков (=переменных=столбцов в матрице с данными). Получается матрица - корреляции каждого из выбранных признаков с каждым. Можно указать и один набор признаков - тогда получится их корреляционная матрица (эквивалентно тому, что вы выберете одинаковые наборы признаков в двух списках). Чтобы получить одно число, нужно выбрать два признака, по одному в каждом списке.
Да, это обычный коэффициент корреляции Пирсона, который измеряет линейную зависимость. Соответственно, применяется, если у вас между признаками зависимость близка к линейной и если нет ошибочных наблюдений (outliers). В остальных случаях применяется непараметрическая статистика. Непараметрические меры зависимости (Спирмена, Кендалла) измеряют монотонную зависимость для количественных признаков, пригодны для порядковых признаков (которые нельзя складывать, но можно сравнивать больше-меньше) и устойчивы к ошибкам в данных.
|