2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему
 
 RMSD или MAD
Сообщение15.02.2017, 18:06 
Аватара пользователя


01/09/13

711
Я могу ошибаться, но мне показалось что в научных (химических) журналах раньше приводили среднеквадратичную ошибку (root-mean-square-deviation, rmsd), а теперь просто среднюю (mean absolute deviation или mean absolute error). Мне непонятно, почему произошёл такой переход; величина rmsd кажется “более математичной”, “менее алгоритмичной”, поскольку в ней нет вычисления модуля, а для MAD нужно вычислять модуль для каждой точки. Вычисление модуля означает оператор if в программе, т.е. некий сдвиг от математики к computer science. Почему же произошла такая подмена?

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение16.02.2017, 00:20 
Заслуженный участник
Аватара пользователя


20/08/14
8072
Linkey в сообщении #1192946 писал(а):
Вычисление модуля означает оператор if в программе, т.е. некий сдвиг от математики к computer science.
А ведь говорил я тогда Дирихле за завтраком: вы, профессор, воля ваша, функцию с оператором if придумали. Оно, может, и умно, но сдвиг от математики к computer science. Над вами потешаться будут.

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение16.02.2017, 00:45 
Заслуженный участник


27/04/09
28128
Linkey в сообщении #1192946 писал(а):
Вычисление модуля означает оператор if в программе
Во-первых (для каждого выбранного вычислительного формализма — и не все они одинаково сильны), одну и ту же функцию могут вычислять несколько «программ» (а так же она может быть и невычислимой). И, в частности, $|x| = \sqrt{x^2}$. Где в выражении справа if?

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение16.02.2017, 08:45 
Заслуженный участник
Аватара пользователя


11/03/08
9527
Москва
По химическим журналам не скажу, а в биомедицинских по-прежнему любят среднеквадратичную ошибку. Товарищ Пифагор позволяет раскладывать квадраты отклонений в сумму квадрата, объясняемого моделью, и объясняемого ошибкой, и вообще пользоваться дисперсионным анализом.
Однако бывают грубые ошибки наблюдений, вызывающие потребность в робастных оценках, и в частности, в замене среднеквадратичной на среднюю абсолютную (или на ещё более робастную, типа медианы абсолютных отклонений или семиинтерквартильного расстояния).
Возможно, в данной предметно области (или в конкретном журнале) эту проблему считают особенно важной. Тут стоило бы ознакомиться с инструкцией для авторов данных журналов, там должен быть раздел по представлению численных результатов.

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение18.02.2017, 03:39 
Аватара пользователя


07/02/12
1403
Питер
Модуль, кстати, сейчас почти везде можно считать очень быстро, а в остальных случаях - довольно быстро (без корней, умножений и условий), что позволяет вычислять его, например, оптом в SIMD.

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение18.02.2017, 08:25 
Заслуженный участник
Аватара пользователя


28/04/16
2388
Внутри ускорителя
Linkey в сообщении #1192946 писал(а):
мне показалось что в научных (химических) журналах

Кст, со стороны химиков могу спросить: в каких именно журналах Вам это показалось? И разброс каких именно величин так характеризуют?

(Оффтоп)

ответы типа "всех" не принимаются, поскольку, я такой тенденции, например, не заметил

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение18.02.2017, 11:04 
Заслуженный участник
Аватара пользователя


11/03/08
9527
Москва
Присоединяюсь к вопросу. Конкретные статьи в конкретных журналах, и тогда можно станет понять - это изменение "статистической моды", специальная мера по обеспечению робастности в конкретном исследовании, употребление автором "средняя" в смысле "среднеквадратичная", поелику он про "среднюю абсолютную" не знает или хотя бы не думает, или ещё что.

-- 18 фев 2017, 11:24 --

bondkim137 в сообщении #1193526 писал(а):
Модуль, кстати, сейчас почти везде можно считать очень быстро, а в остальных случаях - довольно быстро (без корней, умножений и условий), что позволяет вычислять его, например, оптом в SIMD.


"Статистическая мода" на использование модуля, как меря разброса, скорее вызвана его робастностью. Но из робастных оценок он действительно самый простой. Да, и интимно связан с популярной робастной оценкой - медианой (поскольку медиана как раз доставляет минимум средних абсолютных отклонений).

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение18.02.2017, 16:39 
Аватара пользователя


01/09/13

711
madschumacher в сообщении #1193542 писал(а):
Кст, со стороны химиков могу спросить: в каких именно журналах Вам это показалось? И разброс каких именно величин так характеризуют?


Вообще, вы должны лучше меня разбираться в этой теме. Навскидку, вот пара статей:
Why the Standard B3LYP/6-31G Model Chemistry Should Not Be Used in DFT Calculations of Molecular Thermochemistry: Understanding and Correcting the Problem Holger Kruse, Lars Goerigk, and Stefan Grimme. The Journal of Organic Chemistry. dx.doi.org/10.1021/jo302156p |

Обзор: Which functional should I choose? Dmitr Rappoport, Nathan R. M. Crawford, Filipp Furche, and Kieron Burke. December 15, 2008

В первой статье пишут MAD (например энергии активации реакций), во второй MAE (например энергии диссоциации).

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение19.02.2017, 22:30 
Аватара пользователя


07/02/12
1403
Питер
Евгений Машеров в сообщении #1193562 писал(а):
скорее вызвана его робастностью

Вспомнилось, лет шесть наверное назад писали на SSE функцию ошибки для поиска движений для камеры. Квадрат работал плохо из-за шума, а модуль работал плохо из-за того, что модуль. Неплохо работал квадрат после медианного фильтра. Но он работал медленно из-за условий и не любил SIMD. Слепили что-то похожее на псевдо-двухмерный медианный фильтр с маленьким окном, затолкали его в SIMD, как-то работало.

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение20.02.2017, 04:40 
Аватара пользователя


01/09/13

711
bondkim137 в сообщении #1193526 писал(а):
Модуль, кстати, сейчас почти везде можно считать очень быстро, а в остальных случаях - довольно быстро (без корней, умножений и условий), что позволяет вычислять его, например, оптом в SIMD.


А на квантовом компьютере - модуль будет сильно замедлять алгоритм?

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение20.02.2017, 07:46 
Заслуженный участник
Аватара пользователя


28/04/16
2388
Внутри ускорителя
Linkey в сообщении #1193594 писал(а):
Вообще, вы должны лучше меня разбираться в этой теме.

Не вижу для этого причин. :wink:
Linkey в сообщении #1193594 писал(а):
В первой статье пишут MAD (например энергии активации реакций), во второй MAE (например энергии диссоциации).

А, ну тут всё просто. Работы, приведённые Вами, связаны с DFT-расчётами, а в особенности с рассмотрением их "точности" :lol: . Поскольку результаты данных вычислений зависят от положения Плутона в 10-м доме имеют огромный разброс, то для красоты используют ту формулу, по которой циХферка меньше (а, как известно, $\mathrm{MAD} = \frac{1}{N} \sum_{i=1}^N |a_i| \leq \mathrm{RMSD}=\sqrt{\frac{1}{N} \sum_{i=1}^N a_i^2}$). :mrgreen:

 Профиль  
                  
 
 Re: RMSD или MAD
Сообщение21.02.2017, 00:13 
Аватара пользователя


07/02/12
1403
Питер
Linkey, понятия не имею. Н/ф давно не читал

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 12 ] 

Модератор: Модераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: Martynov_M


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group