2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 Среднее против Нижних Квантилей Лог Правдоподобия
Сообщение03.04.2025, 08:27 


08/01/25
39
Мне нужно оценить насколько хорошо распределение вероятности описывает данные, и один из тестов это функция правдоподобия, вычисляемые как значения логарифма плотности log pdf(x) для каждой точки данных.

Мы строим массив [log pdf(x_i)] для каждой точки, и затем вычисляем для этого массива среднее E[log pdf(x)] - чем оно выше, тем лучше совпадение распределения с данными.

Я сравнил два распределения А и Б, и оказалось что для А E[log pdf(x)] выше чем для Б. Т.е. распределение А лучшее.

Но, затем мне пришла мысль (я думаю ошибочная, собственно вопрос в том и состоит чтобы подтвердить что она ошибочная). Можно ведь измерить не только среднее этого массива [log pdf(x_i)], но и квантили, например нижний 0.1 или 10% квантиль Q0.1[log pdf(x)]. Изначально (ошибочно) идея была посмотреть не только общее подобие, но и подобие по редким событиям в хвосте распределения.

И оказалось что "лучшее" распределение А, имеет значение Q0.1[log pdf(x)] хуже чем "худшее" распределение Б. Сначала меня (ошибочно) это насторожило. Но подумав, я решил что все нормально, "худшее" распределение Б ошибочно переоценивает вероятности редких событий, и поэтому значения его нижний квантили получаются выше, это вовсе не значит что оно лучше оценивает редкие события, оно наоборот оценивает их хуже, переоценивая их.

Т.е. получается, смотреть нужно только на среднее, Е[log pdf(x)] оно в том числе обеспечивает совпадение по хвостам распределения. Ориентироваться на квантили не просто нет смысла, но ошибочно в приницпе.

Собственно, хотелось бы подвердить это заключение :). Мне важно не допустить ошибки в оценке редких событий, хвостов распределения.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ 1 сообщение ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group