ipgmvqЕсли я правильно понимаю, какого-то правильного решения от Вас не ждут, иначе не стали бы засекречивать источники проб
Дело в том, что засекретили одни, а ждут другие. Я беру данные местной сан. лаборатории, а политика лаборатории такова, что (видимо, во избежании несанкционированного разглашения того, как у нас плохи дела) даже сами лаборанты, выполняющие анализ, не знают точно откуда проба. В протоколе внесен только код (шифр) пробы, группа (например вода поверхностных водоемов), и еще какое-нибудь указание типа "река", "озеро". В редких случаях может быть название реки. Полные данные знает только заказчик исследования и тот, кто отбирал пробу. А ждут от меня написания магистерской, и там, конечно, все должно быть так, чтоб на защите не к чему было подкопаться.
из каких водоемов их брали — из случайных/неслучайных разных или из одного)
Не из одного, это я точно знаю. Примерные указания типа река, озеро, водовыпуск, пруд - у меня есть. На счет случайности - не совсем случайные. Во первых - все пробы ограничены территорией нашего края. Можно даже примерно прикинуть, какие реки/озера есть в крае. Во-вторых, отбор тоже обусловлен некоторыми правилами. Есть наверное какая-то периодичность, с которой лаборатория контролирует воду в определенной реке. Поэтому, как я говорю, источник может повторяться в разные месяцы один и тот же, но сопоставить пробы из одного источника я не смогу, потому что код будет каждый раз новый. Т.е. частично пробы повторяются, частично новые пробы.
Да и вообще, что именно измеряет средняя или медиана, если пробы берутся рандомно из разных водоемов на территории РФ в разных климатических зонах, с разным уровнем антибиотиков и канализационных вод в водоемах. Это как средняя температура пациентов по больнице (включая морг) и её суточные колебания.
Я планирую исследовать динамику в открытых поверхностных водоемах своего края) Это несколько ограничивает рандомность, и надеюсь, добавляет смысл такому исследованию. Хотя конечно то, что нельзя наверняка сказать, из каких условий взята проба, и их можно считать лишь приблизительно сходными, это слабое место работы, это я понимаю.
Но тут мы должны исходить из того, что это один и тот же водоем, и в данных должны быть даты и в идеале временные метки забора проб
Водоем не один. Но даты и временные метки есть.
Мне кажется, медиана - interquartile range - точками outliers, т.е. стандартный боксплот очень подойдёт
Страдаю от того, что не могу вставить картинку, но дело в том, что я уже делала боксплот
Если вот так получится
https://yandex.ru/collections/card/5f1321e2ef0e1163c1811f34/ вот по данным за год
https://yandex.ru/collections/card/5f1321e2ef0e1163c1811f35/ вот за 3 года
Я чувствую, что графики ужасные, даже область 50% изменений не строится, т.к. она вся к оси прилипла, мне кажется, их не примут...
последнее мне кажется проще, потому что превращает операции умножения и нахождения n-корня в операции сложения и деления на n
Поскольку я не считаю в ручную, а делаю через программу, сложность примерно одинакова, я думаю... но если здесь это не применимо, то ладно, остановлюсь на медианах.
-- 18.07.2020, 23:33 --Евгений МашеровСпасибо за пояснение