Употребление терминов (cтатистика)

sithif · 08.07.2021, 09:05

Помогите разобраться правильно ли используются термины bagging, stacking и ensembling для следующей задачи.

Требуется определить аномальные сигналы в гармонических временных рядах. Есть

n

действительных сигналов длины

l

, их спектры содержат одинаковые частоты, но соответствующие амплитуды могут отличаться. Сигналы измеряются с каким то шумом, можно считать, что в нормальных условиях амплитуды шума близки. Каждый сигнал далее разбивается на

k

частей длины

l'

, получается набор из

n \cdot k

элементов.

Можно ли называть такую процедуру разбиения на куски bagging так как разбиение уменьшает неопределенность?

Далее применяется несколько разных тестов. Тест ставит в соответствие каждому элементу из набора какое то число (feature), по разбросу этих чисел для всего набора элемент может быть выбран как аномальный кандидат. При этом отслеживается происхождение элемента, то есть какому из сигналов он принадлежит изначально. Поэтому можно посчитать сколько раз элементы каждого из сигналов отмечены.

Как правильно называть число отмеченных элементов (кусков) в каждом сигнале? подходит ли здесь термин bagging?

Далее число отмеченных элементов из разных тестов суммируется, подходит ли здесь термин stacking?

Результаты различных тестов используются для оценки доли аномалий (contamination factor) для методов LOF и Isolation Forest. Правильно ли называть их применение с разным начальным условием ensembling?

Как правильно называть случай когда помимо разных начальных условий случайно выбирается только часть данных различных тестов? Например, всего 10 тестов, каждый раз выбираем только 5 и повторяем несколько раз.

Научный форум dxdy

Употребление терминов (cтатистика)