Цитата:
смысл нормировки спектров остаётся для меня весьма туманным.
Если снимать спектры в абсолютных единицах, тогда время и сила тока, на которых снимается спектр, должны быть константы для всего калибровочного набора и аналитических спектров. Такая калибровка не очень стабильна, так как сильно зависит от стабильности работы аппаратуры. Я не железячник, чтобы описать точно, но со временем рентгеновская лампа садится, датчик может работать более грубо, может сказываться дрейф температуры в помещении. И даже если в ПО я указываю один и тот же ток, через один два года он по факту может отличаться от того, что был изначально при калибровке. В автокатализаторах в силу строения их основы, на рентгеновских спектрах всегда есть "линия", которая может быть внутренним стандартом (в пределах некоторых допущений). Тогда при нормировании на внутренний стандарт, не зависимо от абсолютной интенсивности линий, все спектры имеют одинаковый масштаб. Калибровка с внутренним стандартом долговременна и воспроизводится по моим личным наблюдениям спустя 5 лет. Внутренний стандарт удобно даже практически использовать. Например, для точного анализа я снимаю один спектр 3 минуты. Чем дольше время снятия, тем выше абсолютная интенсивность. Калибровка выполняется в тех же условиях. Но если, например, есть необходимость быстро оценить предварительное содержание драгметаллов в образце, я могу снять спектр секунд за 15 и калибровка даст относительно корректный результат, не смотря на то, что время снятия спектра было меньше времени снятия при калибровке в 12 раз.
Цитата:
Правильно ли я McConst понимаю, что измерения в разных диапазонах спектра проводятся на разных интенсивностях, и нормировка преследует своей целью сделать его таким, каким он был бы, будучи полученным на одной и той же стандартной интенсивности для всех диапазонов спектра?
Нет. Бывают разные образцы. Одни достаточно прозрачны для рентгена - из лёгких элементов, другие - из тяжелых элементов - более контрастны. При большей контрастности за счет большей статистики линия становится чётче, выше чувствительность по отношении к фоновым шумам. Наш спектрометр для образцов из лёгких элементов позволяет за счет повышения тока добиться такой же контрастности, что и для образцов из тяжелых. Например, регистрировать 100 тыс. импульсов в секунду для спектров любых элементов. Но в таких случаях нормирование на внутренний стандарт необходимо.
Цитата:
я не совсем понимаю, зачем вообще уточнять
, если для заданной калибровки они не меняются?
Линия, на которую проводится нормирование, она имеет точно такие же свойства, что и линии, которые включены в многочлен для расчета концентрации и обладает всеми теми же недостатками - в ней кроется корреляция с другими интенсивностями. В некоторых вариантах анализа внутренний стандарт может перекрываться с аналитическими линиями. Но раз хемометрика справляется с этими проблемами, почему бы ей не поручить точный расчет интенсивности для нормирования? Прибор даёт площадь линии, как он может её рассчитать, но наверняка в координатах главных компонент нормирование будет более корректно.
На эту тему есть
очень интересная статья. У автора спектральный метод в области ультрафиолета, но принципиальных от меня различий нет. Автор, как большинство химиков, хемометрику недооценил, так как пытался применять не ко всему спектру, а в силу традиции - только к интенсивностям разделенных линий (видно по списку его литературы). А вот сам подход к нормированию на внутренний стандарт использует как и я. Линию нормирования для спектра ищет методом градиентного спуска. В отличие от меня он в статье излагает всё чётко, без тумана и с указанием допущений метода.
Цитата:
Правильно ли я понимаю, что одним единственным уточнением Вы не ограничиваетесь. По полученным
Вы уточняете
и нормируете ими каждый раз исходные данные. Коэффициенты
уточняете итеративно, с целью достижения минимальной ошибки на калибровочных данных?
Правильно.
Цитата:
Но тогда
это уже никакая не нормировка, а просто вспомогательные переменные, которые Вы вводите для повышения точности решения задачи. Физический смысл нормировочных коэффициентов они при этом утрачивают, правильно?
Ну, вот автор статьи, на которую я привел ссылку, он считает, что смысл не утрачен и приводит аргументы. Я вместе с матрицами калибровке в файлах архива прикреплял файлы расчетного и исходного L. Цифры в L отличались, но на проценты - не глобально. То есть физический смысл коренным образом не утрачивался.
Да, было искушение использовать эти данные как просто уточняющие коэффициенты. На маленькой выборке можно подобрать коэффициенты так, чтобы предсказание в проверочном наборе было хорошее, но на большой выборке реальных образцов стабильность предсказания сильно страдает. Выбросы отличаются от МНК в 2-3 раза. При чем МНК в тех случаях явно не врал, так как я знал происхождение образцов и примерное содержание (по серийному номеру на глушителе). Возможно просто выборка маленькая и большим количеством параметров в PCR я нахожу ложный минимум.
Вообще, если тему хемометрического нормирования доведу до ума, то спектр можно будет расширять дополнительными переменными, в которые можно включать техническую информацию типа сила тока, температура в помещении, скорость счёта (импульсы в секунду) и т.д., а градиентный спуск даст оптимальные коэффициенты для нормирования. Есть статьи, где
в качестве линии нормирования используются специальные линии от источника падающего рентгеновского излучения (некогерентного рассеяния). Хемометрический поиск линий мог бы дать оптимальные коэффициенты для нормирования одновременно и по внутреннему стандарту в образце, и по линии некогерентного рассеяния. При этом без особых изменений в принципе расчетов.
Цитата:
Правильно ли я понимаю, что Вы просто не знаете как лучше выбрать оптимальное сочетание из более чем 4 млн. исходных переменных, а PCA - всего лишь удобный способ решения данной проблемы и не более того?
В общем случае - да.