Уважаемые Гуру помогите разобраться как проводить анализ главных компонент.
За основу беру статью:
http://www.gistatgroup.com/gus/book1/index.htmlТам буквально в первой же главе на 5ти страницах описан метод.
(По слухам в инете там много очепяток

)
Я так понял вариаций метода множество, я бы хотел понять как делается корреляционный вариант.
Задача состоит в аппроксимации ряда методом АГК.
Мне нужно именно понять как работает метод чтобы реализовать его в своей программе.
Я понял что метод делится на несколько шагов: Разложение исходного ряда, анализ и выбор главных компонент, восстановление ряда.
Я делаю так:
Есть ряд некой дискретной функции длиной N. Я беру для простоты ряд x = 0,1,2,3 ... 19
Линия с наклоном 45 градусов. Можно взять любую другую, не суть важно.
Задаемся "длиной гусеници" M, термины взяты из статьи.
Допустим это будет

Составляется матрица:

Все как в статье.
Потом вычисляем средние арифметические по столбцам:

И стандартные отклонения:

Далее предлагается матрицу X центрировать на средние арифметические и нормировать на стандарты, для получения матрицы X*, элементы которой равны:

После чего утверждается, что:

Корреляционная матрица!
Я так понимаю что в корреляционной матрице элементы должны лежать в диапазоне от 0 до 1, а по этому расчету некоторые превосходят 1. Следовательно тут где-то ошибка?
У меня есть программа в MatCADе, реализованная мной же по статье, но после этого шага вообще тарабарщина непонятная.
http://webfile.ru/4503809Да! В инете куча всего понаписано по АГК, я уже кучу прочитал, в очередной раз произошел взрыв мозга, но достаточно понятных статей я не нашел, буду признателен за ссылочку на более менее простое и понятное разъяснение.
Помогите пожалуйста разобраться, заранее спасибо
