Обычно, когда имеют дело с такими задачами, набирают побольше данных, получая переопределённые системы, и решают их в смысле наименьших квадратов. Глядя на остатки (там только шум, или есть систематические компоненты?), можно понять, насколько модель подходит к данным.
Как раз склонялся к выбору МНК для построения регрессии. И вообще в целом описанный Вами подход совпадает с моим видением.
Для машинного обучения, к сожалению, слишком мало данных. Организация сенсорных сессий - удовольствие дороге, поэтому на каждый продукт их будет максимум полсотни.
Взаимодействия между факторами (англ. interactions). Если приводить аналогию, пусть у нас есть светильник, в который мы можем вкрутить лампочку или включить выключатель. Если только вкрутить лампочку или только включить выключатель, света не будет; нужно сделать и то, и другое. Для батона и его сенсорной карты это значит, что вместо индивидуальных шкал входных данных наверняка придётся иметь дело с многомерной сеткой параметров и пробовать их различные комбинации. Чем больше параметров, тем это сложнее; это ещё называют проклятьем размерности. Справедливости ради, Ваша пошаговая оптимизация может сработать в случаях, когда форма оптимизируемой функции достаточно проста.
Классика пищевой технологии для разных продуктов, даже очень сложных - с наличием биохимии, почему-то оперирует парами компонент рецепта, точнее их соотношением. Ни разу не видел, чтобы было больше. Поэтому есть надежда обойтись половиной квадрата всех влияющих факторов.
Попробуйте изучить, например, Richard G. Brereton - Applied chemometrics for scientists, главу 2 про планирование эксперимента и 13.5 про связь состава образца с его сенсорной картой, или Gary W. Oehlert - A first course in design and analysis of experiments, главу 19 про response surface designs с примерами про свойства пирога как функции от параметров его выпекания.
Спасибо, ознакомлюсь.
-- 05.07.2022, 20:37 --
Разумеется. Вы же не бетон замешиваете и не сплав металла составляете, где результат можно оценить в точных числах. В кулинарии результаты оцениваются "на глазок", на уровне "мне нравится, но можно бы чуть покислее", и все влияющие на результат факторы имеют соответствующие коридоры допусков. Плюс их взаимное влияние нелинейно. Добавить чуток специи и добавить тот же чуток специи и ещё чуток соли - и результат отличаться будет. А предварительно ту специю разогреть-обжарить - будет третий результат. Кулинария - это шаманство, тут точные подходы работают плохо.
Ну это все я охарактеризовал как влияющие факторы. Очевидно, что их сотни, я перечислил только наиболее очевидные.
А шаманство с течением времени превращается в хорошо понимаемую область со своими эффективными приемами.