2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2
 
 Re: Зачем сокращать число предикторов?
Сообщение03.04.2019, 14:21 
Аватара пользователя


14/02/12

841
Лорд Амбера
Евгений Машеров в сообщении #1385673 писал(а):
Кстати, корень из массы на рост - не та размерность. Там кубический корень должен быть, в предположении геометрического подобия и постоянства плотности при разном росте.

Может мы о разных вещах говорим? Масса = куб роста, итого корень из массы на рост = рост в квадрате, или поверхность. А обмен и пропорционален поверхности, по Рубнеру. Этого не знал Свифт, у него обмен Гулливера больше обмена лилипута в 12 в третьей степени, а не второй (по еде). Т.е. у обмена как корня произведения массы на рост размерность подходящая, но точнее формулы где масса и рост возводятся в разные степени, впрочем близкие к 0,5 - компенсируются нелинейности.

-- 03.04.2019, 15:26 --

Евгений Машеров в сообщении #1385673 писал(а):
То есть постоянство коэффициента при весе у мужчин и женщин постулируется.

В 1990 году современная формула, считающаяся самой точной, группы авторов, Миффлина-СанЖеора, вначале вывели традиционно 2 формулы отдельно для М и Ж, потом приравняли коэффициенты, ввели переменную пол, и по достоверности убедились, что не хуже. Так и гуляет общая формула 1990 года, а вот 1918 года 2 разных.

-- 03.04.2019, 15:30 --

Евгений Машеров в сообщении #1385673 писал(а):
Просто вводится поправка "у мужчин ОО больше у всех на одинаковую величину". То, что соотношение мышечной и жировой ткани у мужчин и женщин разное - пренебрегается.

Я много работал с подообными формулами, оно так и есть. Т.е. при одинаковой массе у Ж больше жировой, и поскольку жировая в 4 раза метаболически менее активная, чем безжировая, разница и выскакивает. Примерно 180-200 ккал в пользу мужчин. Если при изменении масштаба эта разница выйдет 150 или 250 ккал, т.е. ошибка ~50 ккал - несущественно, сигма по данным 1918 года порядка 250 ккал, след. погрешность расчета 500 ккал (при средней 1600-1800 ккал) вполне вероятна.

 Профиль  
                  
 
 Re: Зачем сокращать число предикторов?
Сообщение03.04.2019, 16:18 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Обычно когда говорят "корень" без уточнения, подразумевают квадратный. Объём кубичен к размерам, масса при равной плотности пропорциональна объёму. Чтобы соблюсти размерность - корень из массы должен быть кубическим (хотя учёт изменения как плотности, так и пропорций тела с изменением роста может показатель степени поправить)



Korvin в сообщении #1385727 писал(а):
Т.е. при одинаковой массе у Ж больше жировой, и поскольку жировая в 4 раза метаболически менее активная, чем безжировая, разница и выскакивает. Примерно 180-200 ккал в пользу мужчин.


Ну так она должна выразиться в разнице коэффициентов при массе, а не свободных членов.

 Профиль  
                  
 
 Re: Зачем сокращать число предикторов?
Сообщение03.04.2019, 16:30 
Аватара пользователя


14/02/12

841
Лорд Амбера
Евгений Машеров в сообщении #1385758 писал(а):
Обычно когда говорят "корень" без уточнения, подразумевают квадратный. Объём кубичен к размерам, масса при равной плотности пропорциональна объёму. Чтобы соблюсти размерность - корень из массы должен быть кубическим (хотя учёт изменения как плотности, так и пропорций тела с изменением роста может показатель степени поправить)

Еще раз: при единичной плотности масса пропорциональна кубу роста, масса умноженная на рост есть рост в 4 степени, корень из чего рост в квадрате, т.е. пропорционально площади поверхности, или обмену.

-- 03.04.2019, 17:40 --

Евгений Машеров в сообщении #1385758 писал(а):
Ну так она должна выразиться в разнице коэффициентов при массе, а не свободных членов.

О том и разговор, что ввиду коррелированности массы и роста коэффициенты при них совершенно не отвечают биологическим предположениям, и случайным образом перетекают один в другой, что и позволило М-СЖ в 1990 г объединить выборки М и Ж в одну, введя переменную пол, поскольку убедились на опыте исслед. 1918 г, что коэффициенты ничего не значат, гуляют, а св. члены все выравнивают, и у М-СЖ формула одна на М и Ж, с коэф. при поле 166, т.е. заложено, что между М и Ж разница в обмене 166 ккал. Так примерно и должно быть: если при весе 80 кг в Ж жира 20 кг и 60 кг БЖМ, в М жира 12 кг и 68 кг БЖМ, считая что жир метаболически активен на 25%, приведенная масса женщины 65 кг, мужчины 71 кг. Разница ~ 10%, при обмене 1600 ккал это и есть 160 ккал разницы.

 Профиль  
                  
 
 Re: Зачем сокращать число предикторов?
Сообщение03.04.2019, 17:51 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
Тогда надо бы писать "корень из произведения массы на рост" или "корень из (масса на рост)".
А так понимается "корень из массы на рост", как $\sqrt {m} h$, у унарных операций приоритет.

 Профиль  
                  
 
 Re: Зачем сокращать число предикторов?
Сообщение04.04.2019, 09:59 
Заслуженный участник
Аватара пользователя


11/03/08
9904
Москва
В общем, изложу своё ИМХО.
1. Модель должна быть максимально обоснована содержательно. Подгоночные модели могут быть полезны, если лучше не выходит. Скажем, оценивай я ОО и располагай данными - для начала попытался бы учесть то, что есть разные механизмы энергопотребления. И если потребление мозгом (и некоторыми иными структурами) не зависит от массы и роста, терморегуляция пропорциональна площади поверхности (массе в степени 2/3 или каким конструкциям масса-рост), а есть ещё пропорциональное общей массе потребление - искал бы в виде суммы трёх слагаемых (а знал бы больше - большего числа). При этом каждое слагаемое было бы достаточно свободно в настройке (скажем, показатель во втором не обязан быть 0.666667, а может плавать, отражая некоторые изменения пропорций с массой). Однако такая модель может оказаться слишком сложной для доступных методов оценивания и/или для наличного объёма выборки. И придётся упрощать - но такое упрощение является жертвой и надо понимать, чем жертвуем.
2. Простое увеличение выборки может вовсе не улучшить число обусловленности матрицы, хотя оценка дисперсии этим уточняется. И при таком увеличении могут остаться "парадоксальные" коэффициенты, скажем, с противоречащим интуиции знаком. Это может быть как продуктом игры случайностей при плохо обусловленной матрице регрессоров, так и тем, что "неправильный" коэффициент это поправка на гиперучёт эффекта другого коэффициента. Удаление "нехорошего" регрессора это некая ампутация. Калечащая операция. Возможно, лучше "таблеточками", скажем, ридж-регрессией, уменьшающей значения коэффициентов и при этом они становятся реалистичнее. Увы, формального инструмента для выбора ридж-параметра я не знаю.
3. Искусственное задание соотношений коэффициентов реализовать очень просто, способ я изложил в самом начале. Переход от нескольких регрессоров к их линейной комбинации с заданными коэффициентами и затем "распаковка" коэффициента при комбинации в коэффициенты при исходных регрессорах. Но это значит становиться пленником собственных предрассудков. Мы теряем возможность проверить, насколько коэффициенты разумны. Это скорее способ обмануть себя и заказчика, чем получить правильный ответ. Иногда приходится халтурить и оправдывать себя в этом - но если можно, лучше работать по-честному.
4. Проверка модели, помимо разбивки выборки на обучающую и контрольную, может делаться и "скользящим экзаменом", когда по $(n-1)$ точкам строится модель, проверяемая по оставшейся, и каждая точка выборки по очереди предстаёт "проверочной". Трудоёмкость такого способа не столь существенна при доступных вычресурсах, а используя тождество Ледерманна (у него много имён)
${ \left(A+UCV\right)^{-1}=A^{-1}-A^{-1}U\left(C^{-1}+VA^{-1}U\right)^{-1}VA^{-1}}$
позволяющее на каждом шаге экзамена не обращать матрицу заново, а корректировать за $O(n^2)$ шагов.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 20 ]  На страницу Пред.  1, 2

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: sergey zhukov


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group