То, что нужно делать, зависит от распределения, которое получается в реальности, так что его получение - первая задача.
Распределение может быть абсолютно разным! От равномерного белого шума до идеальной Гауса. От синусоиды (датчик освещения на улице - в среднем 0.5 от дневной яркости) до одинакового числа по всей таблице ("температура тела обычно где-то между 36,6 и 36,6, но в среднем 36,6").
Ради "одноразового решения", которое можно "на глаз" разделить на "полезное и ненужное" я бы не обращался в "лигу математиков" )))
Мне нужен алгоритм, который... как-то (формулами) проанализировав таблицу конечной длины, выдаст не только среднее арифметическое от значений, но и выдаст мне некий верхний и нижний предел, внутри которого помещаются 70% от всех значений.50% от всех значений я уже успешно получил, сначала получив среднее арифметическое, а потом получив среднее арифметическое от того что выше и ниже первого средне-арифметического...
Сейчас экспериментирую с этим "вторыми" "средними", пытаясь их на коефициенты множить... Спорная идея, но может и пройдет! сейчас проверяю...
По какому закону распределена св?
Изначально формулой для рандома была (в екселе)
=50+ROUND(50*RAND())
Отклонение от "нормали" было не большим, но иногда в пределах 3-5% от 50%. Этого хватало чтобы на графике можно было "смещение" заметить. (именно это было на картинке)
Сейчас для тестов добавил к рандому еще коефициент в виде "счетчика в квадрате" - это сильно задрало один бок и сдвинуло средне-арифметическую..
Давайте сколько есть.
Для тестов вполне хватит рандомных значений с белым шумом! Парсингом займусть только когда пойму ради чего стараюсь...