2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2
 
 Re: Зачем сокращать число предикторов?
Сообщение03.04.2019, 14:21 
Аватара пользователя


14/02/12

841
Лорд Амбера
Евгений Машеров в сообщении #1385673 писал(а):
Кстати, корень из массы на рост - не та размерность. Там кубический корень должен быть, в предположении геометрического подобия и постоянства плотности при разном росте.

Может мы о разных вещах говорим? Масса = куб роста, итого корень из массы на рост = рост в квадрате, или поверхность. А обмен и пропорционален поверхности, по Рубнеру. Этого не знал Свифт, у него обмен Гулливера больше обмена лилипута в 12 в третьей степени, а не второй (по еде). Т.е. у обмена как корня произведения массы на рост размерность подходящая, но точнее формулы где масса и рост возводятся в разные степени, впрочем близкие к 0,5 - компенсируются нелинейности.

-- 03.04.2019, 15:26 --

Евгений Машеров в сообщении #1385673 писал(а):
То есть постоянство коэффициента при весе у мужчин и женщин постулируется.

В 1990 году современная формула, считающаяся самой точной, группы авторов, Миффлина-СанЖеора, вначале вывели традиционно 2 формулы отдельно для М и Ж, потом приравняли коэффициенты, ввели переменную пол, и по достоверности убедились, что не хуже. Так и гуляет общая формула 1990 года, а вот 1918 года 2 разных.

-- 03.04.2019, 15:30 --

Евгений Машеров в сообщении #1385673 писал(а):
Просто вводится поправка "у мужчин ОО больше у всех на одинаковую величину". То, что соотношение мышечной и жировой ткани у мужчин и женщин разное - пренебрегается.

Я много работал с подообными формулами, оно так и есть. Т.е. при одинаковой массе у Ж больше жировой, и поскольку жировая в 4 раза метаболически менее активная, чем безжировая, разница и выскакивает. Примерно 180-200 ккал в пользу мужчин. Если при изменении масштаба эта разница выйдет 150 или 250 ккал, т.е. ошибка ~50 ккал - несущественно, сигма по данным 1918 года порядка 250 ккал, след. погрешность расчета 500 ккал (при средней 1600-1800 ккал) вполне вероятна.

 Профиль  
                  
 
 Re: Зачем сокращать число предикторов?
Сообщение03.04.2019, 16:18 
Заслуженный участник
Аватара пользователя


11/03/08
9546
Москва
Обычно когда говорят "корень" без уточнения, подразумевают квадратный. Объём кубичен к размерам, масса при равной плотности пропорциональна объёму. Чтобы соблюсти размерность - корень из массы должен быть кубическим (хотя учёт изменения как плотности, так и пропорций тела с изменением роста может показатель степени поправить)



Korvin в сообщении #1385727 писал(а):
Т.е. при одинаковой массе у Ж больше жировой, и поскольку жировая в 4 раза метаболически менее активная, чем безжировая, разница и выскакивает. Примерно 180-200 ккал в пользу мужчин.


Ну так она должна выразиться в разнице коэффициентов при массе, а не свободных членов.

 Профиль  
                  
 
 Re: Зачем сокращать число предикторов?
Сообщение03.04.2019, 16:30 
Аватара пользователя


14/02/12

841
Лорд Амбера
Евгений Машеров в сообщении #1385758 писал(а):
Обычно когда говорят "корень" без уточнения, подразумевают квадратный. Объём кубичен к размерам, масса при равной плотности пропорциональна объёму. Чтобы соблюсти размерность - корень из массы должен быть кубическим (хотя учёт изменения как плотности, так и пропорций тела с изменением роста может показатель степени поправить)

Еще раз: при единичной плотности масса пропорциональна кубу роста, масса умноженная на рост есть рост в 4 степени, корень из чего рост в квадрате, т.е. пропорционально площади поверхности, или обмену.

-- 03.04.2019, 17:40 --

Евгений Машеров в сообщении #1385758 писал(а):
Ну так она должна выразиться в разнице коэффициентов при массе, а не свободных членов.

О том и разговор, что ввиду коррелированности массы и роста коэффициенты при них совершенно не отвечают биологическим предположениям, и случайным образом перетекают один в другой, что и позволило М-СЖ в 1990 г объединить выборки М и Ж в одну, введя переменную пол, поскольку убедились на опыте исслед. 1918 г, что коэффициенты ничего не значат, гуляют, а св. члены все выравнивают, и у М-СЖ формула одна на М и Ж, с коэф. при поле 166, т.е. заложено, что между М и Ж разница в обмене 166 ккал. Так примерно и должно быть: если при весе 80 кг в Ж жира 20 кг и 60 кг БЖМ, в М жира 12 кг и 68 кг БЖМ, считая что жир метаболически активен на 25%, приведенная масса женщины 65 кг, мужчины 71 кг. Разница ~ 10%, при обмене 1600 ккал это и есть 160 ккал разницы.

 Профиль  
                  
 
 Re: Зачем сокращать число предикторов?
Сообщение03.04.2019, 17:51 
Заслуженный участник
Аватара пользователя


11/03/08
9546
Москва
Тогда надо бы писать "корень из произведения массы на рост" или "корень из (масса на рост)".
А так понимается "корень из массы на рост", как $\sqrt {m} h$, у унарных операций приоритет.

 Профиль  
                  
 
 Re: Зачем сокращать число предикторов?
Сообщение04.04.2019, 09:59 
Заслуженный участник
Аватара пользователя


11/03/08
9546
Москва
В общем, изложу своё ИМХО.
1. Модель должна быть максимально обоснована содержательно. Подгоночные модели могут быть полезны, если лучше не выходит. Скажем, оценивай я ОО и располагай данными - для начала попытался бы учесть то, что есть разные механизмы энергопотребления. И если потребление мозгом (и некоторыми иными структурами) не зависит от массы и роста, терморегуляция пропорциональна площади поверхности (массе в степени 2/3 или каким конструкциям масса-рост), а есть ещё пропорциональное общей массе потребление - искал бы в виде суммы трёх слагаемых (а знал бы больше - большего числа). При этом каждое слагаемое было бы достаточно свободно в настройке (скажем, показатель во втором не обязан быть 0.666667, а может плавать, отражая некоторые изменения пропорций с массой). Однако такая модель может оказаться слишком сложной для доступных методов оценивания и/или для наличного объёма выборки. И придётся упрощать - но такое упрощение является жертвой и надо понимать, чем жертвуем.
2. Простое увеличение выборки может вовсе не улучшить число обусловленности матрицы, хотя оценка дисперсии этим уточняется. И при таком увеличении могут остаться "парадоксальные" коэффициенты, скажем, с противоречащим интуиции знаком. Это может быть как продуктом игры случайностей при плохо обусловленной матрице регрессоров, так и тем, что "неправильный" коэффициент это поправка на гиперучёт эффекта другого коэффициента. Удаление "нехорошего" регрессора это некая ампутация. Калечащая операция. Возможно, лучше "таблеточками", скажем, ридж-регрессией, уменьшающей значения коэффициентов и при этом они становятся реалистичнее. Увы, формального инструмента для выбора ридж-параметра я не знаю.
3. Искусственное задание соотношений коэффициентов реализовать очень просто, способ я изложил в самом начале. Переход от нескольких регрессоров к их линейной комбинации с заданными коэффициентами и затем "распаковка" коэффициента при комбинации в коэффициенты при исходных регрессорах. Но это значит становиться пленником собственных предрассудков. Мы теряем возможность проверить, насколько коэффициенты разумны. Это скорее способ обмануть себя и заказчика, чем получить правильный ответ. Иногда приходится халтурить и оправдывать себя в этом - но если можно, лучше работать по-честному.
4. Проверка модели, помимо разбивки выборки на обучающую и контрольную, может делаться и "скользящим экзаменом", когда по $(n-1)$ точкам строится модель, проверяемая по оставшейся, и каждая точка выборки по очереди предстаёт "проверочной". Трудоёмкость такого способа не столь существенна при доступных вычресурсах, а используя тождество Ледерманна (у него много имён)
${ \left(A+UCV\right)^{-1}=A^{-1}-A^{-1}U\left(C^{-1}+VA^{-1}U\right)^{-1}VA^{-1}}$
позволяющее на каждом шаге экзамена не обращать матрицу заново, а корректировать за $O(n^2)$ шагов.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 20 ]  На страницу Пред.  1, 2

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: ihq.pl


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group