2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.

Если Вы хотите задать новый вопрос, то не дописывайте его в существующую тему, а создайте новую в корневом разделе "Помогите решить/разобраться (М)".

Если Вы зададите новый вопрос в существующей теме, то в случае нарушения оформления или других правил форума Ваше сообщение и все ответы на него могут быть удалены без предупреждения.

Не ищите на этом форуме халяву, правила запрещают участникам публиковать готовые решения стандартных учебных задач. Автор вопроса обязан привести свои попытки решения и указать конкретные затруднения.

Обязательно просмотрите тему Правила данного раздела, иначе Ваша тема может быть удалена или перемещена в Карантин, а Вы так и не узнаете, почему.



Начать новую тему Ответить на тему
 
 Унификация данных
Сообщение20.02.2013, 07:32 


20/02/13
6
Подскажите, пожалуйста. Я работаю с матрицей данных. Имеются $n$ измерений $m$ характеристик одного и того же объекта. Таким образом, матрица $m \times n$. Мне сказали, что путем cингулярного разложения эту матрицу можно свести к вектору размерности $m$ ('обобщенному вектору характеристик'), и якобы информация, хранимая в матрице, сохраняется. Два вопроса. Во-первых, как ее 'свести'? Во-вторых, почему информация об исходной матрице не теряется?

 Профиль  
                  
 
 Re: Унификация данных
Сообщение20.02.2013, 09:43 
Заслуженный участник
Аватара пользователя


11/03/08
10040
Москва
Вам соврали. Или Вы не совсем поняли. Информация теряется. Просто для сингулярного разложения, в определённом смысле, потеря минимальна. А именно восстановленная из сингулярного разложения матрица наиболее близка к исходной в среднеквадратичном смысле.

 Профиль  
                  
 
 Re: Унификация данных
Сообщение20.02.2013, 13:47 


20/02/13
6
Спасибо за ответ. Видимо, не поняла. Вопрос, как найти этот вектор. Мне по задаче надо данные из двухмерного массива заменить одномерным. Погуглив, нашла (http://strijov.com/files/eksamen/l_svd.pdf), как находится сингулярное разложение для квадратной матрицы. У меня m>>n. Более того, написано, что сингулярные векторы - это столбцы матриц в разложении. Мне нужен только один вектор! Если подскажете, как действовать, буду очень благодарна. За советы, где об этом толково написано, тоже.

Т.е. интересует, как матрицу заменить вектором с минимальной в определенном смысле потерей информации.

Спасибо.

 Профиль  
                  
 
 Re: Унификация данных
Сообщение20.02.2013, 15:24 
Заслуженный участник
Аватара пользователя


11/03/08
10040
Москва
Уточните задачу. Если это попросту повторные измерения, полученные без изменения характеристик объекта, то есть различия между ними связаны с ошибками измерения - то речь попросту об определении статистических оценок параметров по выборке.

 Профиль  
                  
 
 Re: Унификация данных
Сообщение20.02.2013, 23:35 


20/02/13
6
Я обнаружила, что совсем некорректно поставила задачу. Задача должна быть такая:
Имеются $n$ измерений $m$ характеристик объектов одной природы в виде матрицы чисел. Например, анализируются 10000 показателей (генная информация) у 50 пациентов больницы и есть основания считать, что у пациентов болезнь одного типа.

Таким образом, данные: матрица $50 \times 1000$. Надо свести эту матрицу к вектору и потом классифицировать к одной из групп пациентов (группы различаются по типам лечения). То есть, надо всех 50 исследуемых больных отнести к одной группе. Руководитель хочет заменить матрицу вектором размерности $1000$ путем cингулярного разложения (и пока только так). И потом классифицировать вектор, используя известные методы классификации.

Я в этих методах разберусь, но пока непонятно, как свести матрицу к вектору.

Спасибо большое за помощь.

 Профиль  
                  
 
 Re: Унификация данных
Сообщение23.02.2013, 17:01 
Заслуженный участник
Аватара пользователя


11/03/08
10040
Москва
У Вас все больные заведомо относятся к одной группе? Это у Вас априори принято?
Тогда любая оценка неизвестного параметра. Ну хоть среднее. Или медиана.
Или всё же группы могут быть различны?

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 6 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group