2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 RMSD или MAD
Сообщение15.02.2017, 18:06 
Аватара пользователя


01/09/13

711
Я могу ошибаться, но мне показалось что в научных (химических) журналах раньше приводили среднеквадратичную ошибку (root-mean-square-deviation, rmsd), а теперь просто среднюю (mean absolute deviation или mean absolute error). Мне непонятно, почему произошёл такой переход; величина rmsd кажется “более математичной”, “менее алгоритмичной”, поскольку в ней нет вычисления модуля, а для MAD нужно вычислять модуль для каждой точки. Вычисление модуля означает оператор if в программе, т.е. некий сдвиг от математики к computer science. Почему же произошла такая подмена?

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение16.02.2017, 00:20 
Заслуженный участник
Аватара пользователя


20/08/14
8062
Linkey в сообщении #1192946 писал(а):
Вычисление модуля означает оператор if в программе, т.е. некий сдвиг от математики к computer science.
А ведь говорил я тогда Дирихле за завтраком: вы, профессор, воля ваша, функцию с оператором if придумали. Оно, может, и умно, но сдвиг от математики к computer science. Над вами потешаться будут.

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение16.02.2017, 00:45 
Заслуженный участник


27/04/09
28128
Linkey в сообщении #1192946 писал(а):
Вычисление модуля означает оператор if в программе
Во-первых (для каждого выбранного вычислительного формализма — и не все они одинаково сильны), одну и ту же функцию могут вычислять несколько «программ» (а так же она может быть и невычислимой). И, в частности, $|x| = \sqrt{x^2}$. Где в выражении справа if?

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение16.02.2017, 08:45 
Заслуженный участник
Аватара пользователя


11/03/08
9491
Москва
По химическим журналам не скажу, а в биомедицинских по-прежнему любят среднеквадратичную ошибку. Товарищ Пифагор позволяет раскладывать квадраты отклонений в сумму квадрата, объясняемого моделью, и объясняемого ошибкой, и вообще пользоваться дисперсионным анализом.
Однако бывают грубые ошибки наблюдений, вызывающие потребность в робастных оценках, и в частности, в замене среднеквадратичной на среднюю абсолютную (или на ещё более робастную, типа медианы абсолютных отклонений или семиинтерквартильного расстояния).
Возможно, в данной предметно области (или в конкретном журнале) эту проблему считают особенно важной. Тут стоило бы ознакомиться с инструкцией для авторов данных журналов, там должен быть раздел по представлению численных результатов.

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение18.02.2017, 03:39 
Аватара пользователя


07/02/12
1403
Питер
Модуль, кстати, сейчас почти везде можно считать очень быстро, а в остальных случаях - довольно быстро (без корней, умножений и условий), что позволяет вычислять его, например, оптом в SIMD.

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение18.02.2017, 08:25 
Заслуженный участник
Аватара пользователя


28/04/16
2388
Внутри ускорителя
Linkey в сообщении #1192946 писал(а):
мне показалось что в научных (химических) журналах

Кст, со стороны химиков могу спросить: в каких именно журналах Вам это показалось? И разброс каких именно величин так характеризуют?

(Оффтоп)

ответы типа "всех" не принимаются, поскольку, я такой тенденции, например, не заметил

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение18.02.2017, 11:04 
Заслуженный участник
Аватара пользователя


11/03/08
9491
Москва
Присоединяюсь к вопросу. Конкретные статьи в конкретных журналах, и тогда можно станет понять - это изменение "статистической моды", специальная мера по обеспечению робастности в конкретном исследовании, употребление автором "средняя" в смысле "среднеквадратичная", поелику он про "среднюю абсолютную" не знает или хотя бы не думает, или ещё что.

-- 18 фев 2017, 11:24 --

bondkim137 в сообщении #1193526 писал(а):
Модуль, кстати, сейчас почти везде можно считать очень быстро, а в остальных случаях - довольно быстро (без корней, умножений и условий), что позволяет вычислять его, например, оптом в SIMD.


"Статистическая мода" на использование модуля, как меря разброса, скорее вызвана его робастностью. Но из робастных оценок он действительно самый простой. Да, и интимно связан с популярной робастной оценкой - медианой (поскольку медиана как раз доставляет минимум средних абсолютных отклонений).

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение18.02.2017, 16:39 
Аватара пользователя


01/09/13

711
madschumacher в сообщении #1193542 писал(а):
Кст, со стороны химиков могу спросить: в каких именно журналах Вам это показалось? И разброс каких именно величин так характеризуют?


Вообще, вы должны лучше меня разбираться в этой теме. Навскидку, вот пара статей:
Why the Standard B3LYP/6-31G Model Chemistry Should Not Be Used in DFT Calculations of Molecular Thermochemistry: Understanding and Correcting the Problem Holger Kruse, Lars Goerigk, and Stefan Grimme. The Journal of Organic Chemistry. dx.doi.org/10.1021/jo302156p |

Обзор: Which functional should I choose? Dmitr Rappoport, Nathan R. M. Crawford, Filipp Furche, and Kieron Burke. December 15, 2008

В первой статье пишут MAD (например энергии активации реакций), во второй MAE (например энергии диссоциации).

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение19.02.2017, 22:30 
Аватара пользователя


07/02/12
1403
Питер
Евгений Машеров в сообщении #1193562 писал(а):
скорее вызвана его робастностью

Вспомнилось, лет шесть наверное назад писали на SSE функцию ошибки для поиска движений для камеры. Квадрат работал плохо из-за шума, а модуль работал плохо из-за того, что модуль. Неплохо работал квадрат после медианного фильтра. Но он работал медленно из-за условий и не любил SIMD. Слепили что-то похожее на псевдо-двухмерный медианный фильтр с маленьким окном, затолкали его в SIMD, как-то работало.

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение20.02.2017, 04:40 
Аватара пользователя


01/09/13

711
bondkim137 в сообщении #1193526 писал(а):
Модуль, кстати, сейчас почти везде можно считать очень быстро, а в остальных случаях - довольно быстро (без корней, умножений и условий), что позволяет вычислять его, например, оптом в SIMD.


А на квантовом компьютере - модуль будет сильно замедлять алгоритм?

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение20.02.2017, 07:46 
Заслуженный участник
Аватара пользователя


28/04/16
2388
Внутри ускорителя
Linkey в сообщении #1193594 писал(а):
Вообще, вы должны лучше меня разбираться в этой теме.

Не вижу для этого причин. :wink:
Linkey в сообщении #1193594 писал(а):
В первой статье пишут MAD (например энергии активации реакций), во второй MAE (например энергии диссоциации).

А, ну тут всё просто. Работы, приведённые Вами, связаны с DFT-расчётами, а в особенности с рассмотрением их "точности" :lol: . Поскольку результаты данных вычислений зависят от положения Плутона в 10-м доме имеют огромный разброс, то для красоты используют ту формулу, по которой циХферка меньше (а, как известно, $\mathrm{MAD} = \frac{1}{N} \sum_{i=1}^N |a_i| \leq \mathrm{RMSD}=\sqrt{\frac{1}{N} \sum_{i=1}^N a_i^2}$). :mrgreen:

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение21.02.2017, 00:13 
Аватара пользователя


07/02/12
1403
Питер
Linkey, понятия не имею. Н/ф давно не читал

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 12 ] 

Модератор: Модераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group