2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


В этом разделе нельзя создавать новые темы.



Начать новую тему Ответить на тему
 
 сингулярное разложение матрицы: оптимальное значение k
Сообщение22.10.2012, 13:04 


22/10/12
1
Kак найти оптимальное значение ранга матрицы, к которой надо редуцировать исходную матрицу при сингулярном разложении?
У меня есть матрица: в строках у нее слова, в столбцах — документы, элементами матрицы представляют собой частоту появления слова в документе(матрица термы на документы term-document matrix ) Мне нужно выявить латентныe зависимости внутри множества документов. Для этого обычно к исходной матрице применяют метод сингулярного разложения. Основная идея латентно-семантического анализа состоит в том, что если в качестве матрицы использовалась матрица термы-на-документы, то матрица, содержащая только первых линейно независимых k компонент , отражает основную структуру различных зависимостей, присутствующих в исходной матрице. Если выбранное значение k слишком велико, то метод теряет свою мощность и приближается по характеристикам к стандартным векторным методам. Слишком маленькое значение k не позволяет улавливать различия между похожими термами или документами. Как выбирают это k? я нашла статью http://dl.acm.org/citation.cfm?id=1277893, где для поиска оптимального k применяется Akaike criterion Они предполагают, что документы имеют нормальное распределение, выпивают функцию правдоподобия, которая представляет собой многомерный интеграл и входит в критерий Aкаике.. затем вычисляют критерий для каждого k, а k, на котором он минимален, принимают за оптимальное

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ 1 сообщение ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group