2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Унификация данных
Сообщение20.02.2013, 07:32 
Подскажите, пожалуйста. Я работаю с матрицей данных. Имеются $n$ измерений $m$ характеристик одного и того же объекта. Таким образом, матрица $m \times n$. Мне сказали, что путем cингулярного разложения эту матрицу можно свести к вектору размерности $m$ ('обобщенному вектору характеристик'), и якобы информация, хранимая в матрице, сохраняется. Два вопроса. Во-первых, как ее 'свести'? Во-вторых, почему информация об исходной матрице не теряется?

 
 
 
 Re: Унификация данных
Сообщение20.02.2013, 09:43 
Аватара пользователя
Вам соврали. Или Вы не совсем поняли. Информация теряется. Просто для сингулярного разложения, в определённом смысле, потеря минимальна. А именно восстановленная из сингулярного разложения матрица наиболее близка к исходной в среднеквадратичном смысле.

 
 
 
 Re: Унификация данных
Сообщение20.02.2013, 13:47 
Спасибо за ответ. Видимо, не поняла. Вопрос, как найти этот вектор. Мне по задаче надо данные из двухмерного массива заменить одномерным. Погуглив, нашла (http://strijov.com/files/eksamen/l_svd.pdf), как находится сингулярное разложение для квадратной матрицы. У меня m>>n. Более того, написано, что сингулярные векторы - это столбцы матриц в разложении. Мне нужен только один вектор! Если подскажете, как действовать, буду очень благодарна. За советы, где об этом толково написано, тоже.

Т.е. интересует, как матрицу заменить вектором с минимальной в определенном смысле потерей информации.

Спасибо.

 
 
 
 Re: Унификация данных
Сообщение20.02.2013, 15:24 
Аватара пользователя
Уточните задачу. Если это попросту повторные измерения, полученные без изменения характеристик объекта, то есть различия между ними связаны с ошибками измерения - то речь попросту об определении статистических оценок параметров по выборке.

 
 
 
 Re: Унификация данных
Сообщение20.02.2013, 23:35 
Я обнаружила, что совсем некорректно поставила задачу. Задача должна быть такая:
Имеются $n$ измерений $m$ характеристик объектов одной природы в виде матрицы чисел. Например, анализируются 10000 показателей (генная информация) у 50 пациентов больницы и есть основания считать, что у пациентов болезнь одного типа.

Таким образом, данные: матрица $50 \times 1000$. Надо свести эту матрицу к вектору и потом классифицировать к одной из групп пациентов (группы различаются по типам лечения). То есть, надо всех 50 исследуемых больных отнести к одной группе. Руководитель хочет заменить матрицу вектором размерности $1000$ путем cингулярного разложения (и пока только так). И потом классифицировать вектор, используя известные методы классификации.

Я в этих методах разберусь, но пока непонятно, как свести матрицу к вектору.

Спасибо большое за помощь.

 
 
 
 Re: Унификация данных
Сообщение23.02.2013, 17:01 
Аватара пользователя
У Вас все больные заведомо относятся к одной группе? Это у Вас априори принято?
Тогда любая оценка неизвестного параметра. Ну хоть среднее. Или медиана.
Или всё же группы могут быть различны?

 
 
 [ Сообщений: 6 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group