Евгений, спасибо за вдумчивый ответ! :)
Переменная облачность в моей голове проясняется.. )))
Цитата:
Если для различных иксов постоянен не абсолютный разброс y, а относительный, так что с ростом y увеличивается и разброс, порождённый случайными причинами, логарифмирование может помочь.
Допустим, у нас есть несколько таких наборов данных и нам нужно статистически грамотно 1) описать каждый из них, 2) сравнить их друг с другом.
Для описания можно рассчитать геометрическое среднее перичных данных, его ошибку и геометрическое стандартное отклонение, а затем уже оценить этот набор данных.
Как для описания, так и для сравнения можно
log-трансформировать сразу все данные, а затем уже общаться с ними, как с нормально распределёнными (и рассчитать среднее арифметическое и его ошибку, стандартное отклонение, провести
t-анализ Стьюдента, ANOVA). Затем можно осуществить обратное log-трансформирование необходимых статистических показателей (скажем, средние и ошибки) и привести их в качестве иллюстрации (и это уже будут не условные единицы, а реальные кг, мл, шт. и т.п.).
Эти рассуждения верны? Если нет, то где ошибка, укажите, пожалуйста.
Столкнулся с тем, что некоторые значения

столь малы, что

. Т.е. получаются отрицательные числа. Я так понимаю, что это не особо хорошо. Порылся в инете, нашёл, что в таких случаях можно прибавить ко всем
log-трансформированным данным некое

, такое, чтобы

. Как выбрать это

? Совершенно произвольно, только чтобы удовлетворяло условиям? Напр., если наименьшее значение в
log-трансформированном ряду данных равняется

, то я могу просто добавить ко всем значениям

и, избавившись от отрицательных значений, дальше бодро делать расчёты? А куда потом эту

девать? Надо будет, видимо, её вычитать откуда-то (напр., из средних)? Как всё это корректно сделать?