В процессе тестирования разных конфигураций компьютеров после воспроизведения тестового сценария получаются данные: номера кадров и времена их построения.
Для оценки уровня шума используется следующая метрика: в скользящем окне в десять кадров расчитывается коэффициент вариации (отношение СКО к МО для этих 10ти кадров), затем вычисляется МО этого коэффициента(среднее по всему бенчмарку). Назовем эту величину

.
Корректно ли проводить сравнительную оценку уровня шума

двух прогонов тестового сценария на конкурирующих конфигурациях?

Если нет, то каким образом можно произвести сравнительную оценку шума?