2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Какой-то критерий для объединения множеств
Сообщение02.04.2023, 19:53 


23/02/23
128
Здравствуйте!

У меня есть два набора точек в 3-х мерном пространстве $x_i \in R^3, i=1,...,N_x$ и $y_i \in R^3, i=1,...,N_y$, для которых я могу посчитать среднее и среднеквадратичное, и мне надо придумать какой-то критерий, по которому я разрешал бы объединять этот набор точек в один общий набор, например, если объединенный набор бы вписывался в шар не на много больший, чем любой исходный набор.

У меня нет доступа к самим точкам, я только могу изначально посчитать какие-то интегральные характеристики, как то сумму по координатам, сумму квадратов, число точек, может быть суммы всех возможных покоординатных произведений.

Скажите, пожалуйста, какие критерии такого объединения обычно используются?

 Профиль  
                  
 
 Re: Какой-то критерий для объединения множеств
Сообщение02.04.2023, 20:46 


10/03/16
4444
Aeroport
Погуглите что-нибудь про кластеризацию.

 Профиль  
                  
 
 Re: Какой-то критерий для объединения множеств
Сообщение02.04.2023, 20:53 


23/02/23
128
Спасибо, ozheredov да, гуглил, все критерии кластеризации требуют обхода всех точек, а я это хочу избежать. То есть есть наивный критерий - посчитать среднее обоих распределений, посчтать среднеквадратичное отклонение в суммарном распределении и в исходных, но ведь у объединенного множества всегда получаемый шар будет не меньше. Все остальное, когда можно отбросить выпадающие точки, или среднемедианные - требуют знания всех точек.

 Профиль  
                  
 
 Re: Какой-то критерий для объединения множеств
Сообщение02.04.2023, 20:55 


10/03/16
4444
Aeroport
zgemm
Когда Вы считаете среднее или скв-отклонение, Вы все точки не обходите?

 Профиль  
                  
 
 Re: Какой-то критерий для объединения множеств
Сообщение02.04.2023, 21:45 


23/02/23
128
ozheredov в сообщении #1587997 писал(а):
zgemm
Когда Вы считаете среднее или скв-отклонение, Вы все точки не обходите?

Конечно обхожу, но это делается один раз на исходный набор точек. Таких наборов у меня очень много. Далее я хочу некоторые наборы объединить, если в них оказались точки, которые находятся "близко". И вот во время объединения я не хочу обходить эти точки снова и снова. По хорошему, у меня, скажем, $10^5$ наборов точек, и мне надо провести очень много, в худшем случае $5\times10^9$ сравнений, а я ожидаю, что после всех таких сравнений и объединений у меня останется порядка $10^3$ наборов. Так как в каждом наборе всреднем около ста точек до начала сравнений и около десяти тысяч к концу сравнений, использовать для сравнения все точки не хотелось бы.

 Профиль  
                  
 
 Re: Какой-то критерий для объединения множеств
Сообщение02.04.2023, 23:11 
Заслуженный участник
Аватара пользователя


01/09/13
4690
zgemm в сообщении #1588014 писал(а):
И вот во время объединения я не хочу обходить эти точки снова и снова.

а как Вы рассчитаете среднее и дисперсию для объединения?

 Профиль  
                  
 
 Re: Какой-то критерий для объединения множеств
Сообщение02.04.2023, 23:34 


23/02/23
128
Geen в сообщении #1588033 писал(а):
а как Вы рассчитаете среднее и дисперсию для объединения?

Так вроде просто же?

Пусть

$s_1 = \sum_{i=1}^{N_x} x_i \in R^3, s_2 = \sum_{i=1}^{N_x} ||x_i||_2^2 \in R$, и я запоминаю для каждого исходного набора эти самые $s_1$, $s_2$, и, конечно же $N_x$.

В силу аддитивности, для объединения двух наборов я смогу получить значения $s_1$, $s_2$ простым суммированием и из него получить и среднее и дисперсию.

Очевидно можно запоминать и не только такие простые вещи, но и что-то типа

$\sum_{i=1}^{N_x} x_i x_i^T \in R^{3 \times 3}$

но поможет ли мне знание эллипса распределения дисперсии - пока для меня не очевидно.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 7 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: Утундрий


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group