2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Зачем среднеквадратическое отклонени умножать на 2?
Сообщение30.06.2014, 11:29 
Здравствуйте. У меня глупый вопрос. Разбирал описание питоновской библиотеки и наткнулся на строчку:

Цитата:
The mean score and the standard deviation of the score estimate are hence given by:

Код:
>>> print("Accuracy: %0.2f (+/- %0.2f)" % (scores.mean(), scores.std() * 2))
Accuracy: 0.97 (+/- 0.07)


http://scikit-learn.org/stable/modules/cross_validation.html#computing-cross-validated-metrics

А зачем они ее на 2 то умножают?

 
 
 
 Re: Зачем среднеквадратическое отклонени умножать на 2?
Сообщение30.06.2014, 12:13 
Аватара пользователя
Видимо такая философия. Ибо если вы честно ручками посчитаете дисперсию, то получится $0.001344$ что-то такое. Далее принято из нее корень извлекать, получаем $0.03666$. Может человеческая дисперсия это $2\sigma$, кто знает.

 
 
 
 Re: Зачем среднеквадратическое отклонени умножать на 2?
Сообщение30.06.2014, 15:11 
Аватара пользователя
Я бы предположил, что это доверительный интервал такой, 95%. С округлением 1.96 до 2.

 
 
 
 Re: Зачем среднеквадратическое отклонени умножать на 2?
Сообщение30.06.2014, 15:26 
Аватара пользователя
В естественных науках принято умножать на 3. Это называется "правило $3\sigma$". Одно стандартное отклонение даёт слишком большую вероятность, что число выпадет из указанного интервала - около 32 % для нормального распределения. Поэтому откладывают несколько стандартных отклонений - так, чтобы эта вероятность сильно упала. Двух-трёх хватает. За три сигма выходит уже меньше процента случаев.

В физике элементарных частиц требования строже, там добиваются $5\sigma.$ Например, бозон Хиггса искали, накапливая статистику до $5\sigma$ (в одном из двух опытов дотянули до $4{,}9\sigma,$ ну да ладно). В пределах $3\sigma$ его "видели" и раньше, но не полагалось рапортовать об открытии. Бывали случаи, когда что-то в пределах $3\sigma$ "открывали", а потом "закрывали". С $5\sigma$ такого никогда не бывало.

 
 
 
 Re: Зачем среднеквадратическое отклонени умножать на 2?
Сообщение30.06.2014, 15:47 
Евгений Машеров в сообщении #882274 писал(а):
Я бы предположил, что это доверительный интервал такой, 95%. С округлением 1.96 до 2.

Munin в сообщении #882283 писал(а):
В естественных науках принято умножать на 3. Это называется "правило $3\sigma$". Одно стандартное отклонение даёт слишком большую вероятность, что число выпадет из указанного интервала - около 32 % для нормального распределения. Поэтому откладывают несколько стандартных отклонений - так, чтобы эта вероятность сильно упала. Двух-трёх хватает. За три сигма выходит уже меньше процента случаев.

Вот я тоже про $3\sigma$ подумал. Но почему 2? Я не слышал никогда про два. Понятно, что точность увеличились, но можно было с тем же успехом и другие числа брать.

Я посмотрел в википедии, в интервале $\pm2\sigma$ лежит $0,954%$ результата. Так что думаю именно из-за цифры 0,95 выбрана. Большое спасибо:)

 
 
 
 Re: Зачем среднеквадратическое отклонени умножать на 2?
Сообщение30.06.2014, 18:15 
Аватара пользователя
Ну, довольно часто применяемый в естественных науках (скорее в "полуточных", типа биологии и медицины) уровень значимости 5%. Возможно, ориентируются на него.

 
 
 [ Сообщений: 6 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group