Вы писали, что скорее всего проблема была в выборе количества ГК.
Я думаю, да, плюс ещё проблема в нормировании.
Когда я считаю по ММНК по линиям - интенсивности прибор вычисляет самостоятельно по площадям, в том числе и площадь для пика нормирования.
Раньше, когда я только-только начинал использовать хемометрическую обработку, интенсивность для нормирования я брал с прибора и делил все каналы на эту интенсивность - для каждого спектра свою. Подход получился не универсальный, так как пик нормирования, хоть он и большой, не свободен от влияния других интенсивностей, его границы для вычисления площади прибор предлагает аналитику задавать самостоятельно. То есть просится, чтобы хемометрика искала этот пик самостоятельно. Простейшее решение - это провести ещё одну калибровку для поиска коэффициентов расчета пиков нормирования. Градуировка получается в два этапа. Сначала вычисляется по калибровке пик нормирования, затем после нормирования используется уже окончательная градуировка.
Далее, так как границы пика выбраны аналитиком, целесообразно было скорректировать параметры нормирующих интенсивностей так, чтобы они оптимально отвечали модели, а не исходя из соображений аналитика. Для этого счета для поиска нормировочных интенсивностей нужно было слегка подправить. Подправку делал с помощью Левенберга-Марквардта, добиваясь минимума между расчетными и аттестованными значениями концентраций после нормирования. Приборные данные использовал в качестве начального приближения. В архиве для L два файла - данные прибором, и полученные после расчета. И те и те интенсивности достаточно близки, поэтому можно говорить, что сильных искажений в физический смысл нормирования на внутренний стандарт такая оптимизация не внесла.
В принципе, метод работает, но у меня подозрения, что это псевдокомпоненты. Так как первые 15 счетов вектора L, скажем для 17 компонент не совпадают со счетами для разложения на L 15 компонент... Оптимизация корректирует их по разному. Возможно проблема с минимумом связано именно с этим.
Когда вы стали смотреть согласованность данных, я решил, что возможно проблема в том, что я получил локальный минимум. Для этого нужно было попробовать разные начальные условия, поэтому начал подбирать их исходя из свойств спектральной матрицы. Было бы вообще здорово, если бы градуировка нормирующей линии полностью опиралась только на то, как выглядит спектр. Хорошая сходимость для градуировочной и проверочной матриц получалась для нормирования платины, если в качестве начального вектора для нормирования использовать среднее по всем каналам для каждого спектра на 20 и 21 компоненте. Если вычислить вектор, полученный для 21-й компоненты из средних каналов, то вышло "неплохое" начальное значение для уравнения оптимизации. Получилось так, что минимум для проверочной и калибровочной матрицы сошелся на 17 компонентах. Графики вроде бы красивые, и нулевые значения концентраций реально измеряются нулями, но в сравнении с ММНК на аналитических образцах, явные выбросы. Просто по линиям видно, что так быть не может. То есть получается, я подогнал картинку под желаемое, но желаемого не добился.
Думаю, в чем может быть ещё логическая ошибка при нормировании, если считать, что выбор расчетного спектра в качестве начального значения для оптимизации был правильным? Нормирование по приборным интенсивностям даёт ошибку больше ММНК, хотя принцип расчета по существу один и тот же как в ММНК. Ниже покажу спектр и ту часть, где находится нормирующая интенсивность на спектре.
На шкале где-то с 17 до 35 кВ видно, что фон поднимается. Площадь под фоном - это и есть та линия нормирования, образованная примерно 90% недетектируемых элементов керамики катализатора (Al, O, C). Возможно при подготовке к градуировке по PCR я неправильно делаю нормирование. Например, в ММНК высота линии - высота минус фон. А я здесь нормировал абсолютную величину в каналах. Возможно, в PCR поступает искаженная информация об относительных единицах в спектре. Справляется ли PCR с такими входными данными? Наверное более корректно будет исходную матрицу центрировать, а потом нормировать? Тогда в PCR будут поступать относительные отклонения от центрального спектра. Прав ли я в своей логике? Я попробую с цифрами поиграть, но возможно вы у меня сразу найдёте какие-нибудь логические ошибки.
И ещё одна мысль. На данным момент у меня стоит задача добиться от PCR с нормированием хотя бы такой же стабильности и качества градуировки как и по линиям ММНК. Имеется большой массив спектров от автокатализаторов, проанализированный по ММНК, набранный за годы работы. PCR и ММНК, как видно на предыдущей странице этого форума на графике, во многом повторяют друг друга - одинаковые ошибки модели и качества образцов. А можно ли вместо массива проверочных образцов, который состоит из 25 штук, использовать массив накопленных аналитических данных, в качестве проверки стабильности градуировки. Думаю, за годы чего только не проанализировал. Более 10 тыс спектров. Данный объем можно использовать как показатель почти реального прогноза при поиске начального приближения и количества ГК - через минимальную ошибку с ММНК. Эта стратегия тоже подгонки под ответ, но ответ условно проверен большим объемом данных. А уже потом смотреть какие проблемы всплыли и как их решать.
Пока так. Другого путного ничего в голову пока не пришло.