Читаю книгу Николенко и соавторов по глубокому обучению.
Смотрю главу по теореме Байеса.
Дается известная задача об определении вероятности, что человек заболел некоторой болезнью, если у него положительный тест:
Цитата:
Предположим, что некий тест на какую-нибудь страшную болезнь имеет вероятность успеха 95 %; иначе говоря, 5 % — это вероятность как ошибки первого рода (ложного срабатывания, false positive), так и ошибки второго рода (пропуска больного человека, false negative). Предположим также, что болезнь очень распространена и имеется у 1 % респондентов. Отложим на время то, что респонденты могут быть разного возраста и профессий — будем предполагать, что больные люди в нашем эксперименте выбираются из популяции случайно и равномерно.
Пусть теперь некий человек (все так же случайно и равномерно выбранный из популяции) получил позитивный результат теста, то есть тест говорит, что
страшная болезнь у человека присутствует. С какой вероятностью он действительно болен? Попробуйте, прежде чем подсчитать или прочитать ответ, оценить свою интуицию: как бы вы оценили вероятность болезни, если бы получили позитивный
результат от такого теста?
Давайте сначала подсчитаем результат точно. Обозначим через t результат теста, через d — наличие болезни. Тогда:
.
Используем теорему Байеса:
В чем загвоздка:
По тексту тест на болезнь имеет вероятность успеха 95 % (скан 1, условие).
В то же время в тексте читаем, что
- это есть вероятность положительного теста, когда человек болеет (см. скан 2, решение).
Но! Вероятность 95% включает в себя и тот случай, когда тест отрицательный у здорового человека (см. условие)!!!
Я неверно понял?