Seomotion писал(а):
Главным вопросом задачи является: нахождение корреляции. Предварительно нужно найти коэффициент Спирмена, коэффициент Кендэла, взяв за X – ВВП на душу населения, а за Y – балл ИВК, далее проранжировать их в порядке возрастания, найти балл коррупции (P и Q) и скользящие по Спирмену и по Кендэлу.
Сколько это будет стоить денег и может ли кто-нибудь это решить?
Cначала решим совсем простую задачу.
Даны две таблички рангов (например по росту и весу пяти человек)
1 таблица сразу сортирована по возрастанию: (1 2 3 4 5) по росту (она же указывает на порядковый номер человека).
2 таблица не сортируется, а просто указаны ранги (3 2 1 4 5) по весу.
Требуется оценить зависимость веса от роста для выборки из 5 человек (не физических величин, а рангов - номеров мест, занимаемых в таблице, сортированной по возрастанию физической величины).
1. Посчитаем абсолютную разницу рангов для этих рядов (2 0 2 0 0).
2. Видим, что в 3 случаях из 5 ранг роста совадает с рангом веса. Делаем заключение: с вероятностью 3/5 вес положительно зависит от роста..
3. Придумаем математический критерий такой, чтобы его значение сразу показывало знак (+ -) и модуль значения в пределах единицы (1). Формула:
, где S=2 - количество не совпадающих рангов, N =5 - количество людей в выборке, K - назовем критерием Архипова. Вычисляем:
. Заключаем: существует положительная связь между весом и ростом. Судя по её значению, назовем её хорошей .
4. Критерий Кенделла
. S - сумма абсолютных разностей рангов (из таблички (2 0 2 0 0)), (N^2+N)/2 - cумма рангов из N человек. Судя по её значению, назовем её хорошей коореляцией.
5. Критерий Спирмена
. S - сумма квадратов разностей рангов из таблички (2 0 2 0 0), (N^3-N^2)/2 - cумма квадратов рангов из N человек. Судя по её значению, назовем её хорошей коореляцией.
Если критерии окажутся отрицательными (например -0,8), то назовем его значение хорошей обратной зависимостью (чем больше рост - тем меньше вес). Вот такой общий смысл этих критериев.