Анализ главных компонент, помогите разобраться плз

logout2d · 24.05.2010, 15:59

Уважаемые Гуру помогите разобраться как проводить анализ главных компонент.
За основу беру статью:
http://www.gistatgroup.com/gus/book1/index.html
Там буквально в первой же главе на 5ти страницах описан метод.
(По слухам в инете там много очепяток :-)

)
Я так понял вариаций метода множество, я бы хотел понять как делается корреляционный вариант.

Задача состоит в аппроксимации ряда методом АГК.
Мне нужно именно понять как работает метод чтобы реализовать его в своей программе.

Я понял что метод делится на несколько шагов: Разложение исходного ряда, анализ и выбор главных компонент, восстановление ряда.

Я делаю так:
Есть ряд некой дискретной функции длиной N. Я беру для простоты ряд x = 0,1,2,3 ... 19
Линия с наклоном 45 градусов. Можно взять любую другую, не суть важно.
Задаемся "длиной гусеници" M, термины взяты из статьи.
Допустим это будет $M=N/2$
Составляется матрица:
$\mathbf{X} = \left( \begin{array}{cccc} x_{1} & x_{2} & \ldots & x_{M} \\ x_{2} & x_{3} & \ldots & x_{M+1} \\ \vdots & \vdots & \ddots & \vdots \\ x_{k} & x_{k+1} & \ldots & x_{N} \end{array} \right)$
Все как в статье.
Потом вычисляем средние арифметические по столбцам:
$\bar x_{j} = \frac 1 k \sum\limits_{i=1}^k x_{i+j-1}$
И стандартные отклонения:
$s_{j} = \sqrt{ \frac 1 k \sum\limits_{i=1}^k ( x_{i+j-1} - \bar x_{j} )^2 }$
Далее предлагается матрицу X центрировать на средние арифметические и нормировать на стандарты, для получения матрицы X*, элементы которой равны:
$x_{ij}^* = (x_{ij} - \bar x_{j}) / s_{j}$
После чего утверждается, что:
$R = \frac 1 k X^*(X^*)^T$
Корреляционная матрица!
Я так понимаю что в корреляционной матрице элементы должны лежать в диапазоне от 0 до 1, а по этому расчету некоторые превосходят 1. Следовательно тут где-то ошибка?

У меня есть программа в MatCADе, реализованная мной же по статье, но после этого шага вообще тарабарщина непонятная.
http://webfile.ru/4503809

Да! В инете куча всего понаписано по АГК, я уже кучу прочитал, в очередной раз произошел взрыв мозга, но достаточно понятных статей я не нашел, буду признателен за ссылочку на более менее простое и понятное разъяснение.

Помогите пожалуйста разобраться, заранее спасибо :-)

logout2d · 25.05.2010, 08:47

В англоязычной литературе метод называется PCA - Principal Component Analysis
Может кто-то сталкивался

IE · 25.05.2010, 11:04

Почитайте Ивченко, Медведев: Введение в математическую статистику. Там все хорошо и понятно изложено, не вижу смысла пересказывать.

logout2d · 25.05.2010, 23:22

Спасибо за ответ, но я что-то не нашел в оглавлении "Метод анализа главных компонент" или похожую тему, укажите пожалуйста страницу где вы это нашли. Или вы просто предложили учебник по статистике и анализу рядов?
Книга называется "Ивченко Г.И.Медведев Ю.И.Математическая стастика: учебное пособие для втузов. 1984г"
Или я не то читаю? Нужно именно "Ивченко, Медведев: Введение в математическую статистику"?

IE · 26.05.2010, 06:41

Ивченко Г.И., Медведев Ю.И.
Введение в математическую статистику. 2010

logout2d · 26.05.2010, 08:52

В интернете есть к сожалению только оглавление, действительно в нем есть какие-то главные компоненты :-)

Спасибо, на днях зайду в магазин.

IE · 26.05.2010, 09:40

Там всего 9 страничек, так что я сделал скан:
Компонентный анализ.pdf

logout2d · 26.05.2010, 13:46

IE в сообщении #323998 писал(а):

Там всего 9 страничек, так что я сделал скан:
Компонентный анализ.pdf

Огромное спасибо за скан! :-)

Не пришлось бегать по магазинам :-)

Да, похоже изложена моя тема :-)

По крайней мере теория стала ясней.
Буду дальше разбираться.

Слушай одна просьба! На странице 566, сразу перед параграфом 9.2, написано:
"Этот метод хорошо изложен в книге [1]"
Посмотри пожалуйста что за книга [1].

IE · 26.05.2010, 13:59

Андерсон Т. Введение в многомерный статистический анализ.

logout2d · 26.05.2010, 14:08

1963 года? Спасибо!

Научный форум dxdy

Анализ главных компонент, помогите разобраться плз