Привет!
Делаю оценку параметров по методу максимального правдоподобия и хочу также вычислить доверительный интервал полученных оценок через гессиан, но получаю странные результаты. Понимаю, что доверительный интервал можно получить и численно, бутстрепом, например, но хотел бы разобраться в том, как это сделать аналитически.
Задача такая:
Есть серия из
парных игр, в каждой из которых есть победитель (нет ничьих или незавершённых игр), и есть
участников этих игр.
Решим задачу ранжирования участников серии попарных сравнений по итогам завершения всех испытаний.
Предположим, что каждому участнику
соревнования соответствует
— балл, характеризующий его способность победить.
Пусть при этом вероятность победы участника
над участником
определяется так:
, причём
.
Обозначим совокупность баллов
участников как
. Тогда функция правдоподобия для полной совокупности испытаний:
где
— количество побед участника
над участником
. Считаем, что все
, что соответствует естественному восприятию: у самого себя ни один участник не выигрывал.
Запишем логарифм функции правдоподобия
:
Первые частные производные логарифма:
Вторые:
Максимум логарифма функции правдоподобия достигается при равенстве нулю компонент градиента:
поэтому:
Таким образом, значение
, соответствующее максимуму правдоподобия, можно найти итеративно:
Если обозначим суммарное количество побед
-го участника во всех сравнениях как
будем иметь:
После завершения итерационной процедуры отнормируем полученные значения:
Эта часть вопросов не вызывает и сходится к правильным значениям на специально сгенерированных данных.
Далее я пытаюсь сделать оценку доверительного интервала, но не получается.
Делаю так:
Я хочу рассчитать оценки СКО параметров как корни диагональных элементов матрицы, обратной к информационной матрице Фишера
которая, в свою очередь, будет равна матожиданию гессиана, домноженному на
.
Матожидание элементов гессиана с учётом того, как зависит вероятность победы от баллов участников, будет выглядеть так:
Диагональные элементы, из которых нужно извлекать корни, получаются очень большими, и полученные из них значения СКО на много порядков превышают значения оцениваемых параметров.
При этом если в формулу для матожидания гессиана вместо
подставить
, значения СКО получаются очень похожими на те, что получаются методом бутстрепа, но это, очевидно, неверно.
Помогите, пожалуйста, понять, в чём ошибка.