2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 04:10 
Аватара пользователя


21/01/09
3925
Дивногорск
AndyJ в сообщении #1539642 писал(а):
Да и нет в них пока даже 100 записей для начала анализа.
Давайте сколько есть.
AndyJ в сообщении #1539642 писал(а):
Поэтому учусь на чистом рандоме.
По какому закону распределена св?

 Профиль  
                  
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 04:38 


04/08/20
19
Pphantom в сообщении #1539643 писал(а):
То, что нужно делать, зависит от распределения, которое получается в реальности, так что его получение - первая задача.

Распределение может быть абсолютно разным! От равномерного белого шума до идеальной Гауса. От синусоиды (датчик освещения на улице - в среднем 0.5 от дневной яркости) до одинакового числа по всей таблице ("температура тела обычно где-то между 36,6 и 36,6, но в среднем 36,6").

Ради "одноразового решения", которое можно "на глаз" разделить на "полезное и ненужное" я бы не обращался в "лигу математиков" )))

Мне нужен алгоритм, который... как-то (формулами) проанализировав таблицу конечной длины, выдаст не только среднее арифметическое от значений, но и выдаст мне некий верхний и нижний предел, внутри которого помещаются 70% от всех значений.

50% от всех значений я уже успешно получил, сначала получив среднее арифметическое, а потом получив среднее арифметическое от того что выше и ниже первого средне-арифметического...

Сейчас экспериментирую с этим "вторыми" "средними", пытаясь их на коефициенты множить... Спорная идея, но может и пройдет! сейчас проверяю...

Александрович в сообщении #1539644 писал(а):
По какому закону распределена св?

Изначально формулой для рандома была (в екселе)
=50+ROUND(50*RAND())
Отклонение от "нормали" было не большим, но иногда в пределах 3-5% от 50%. Этого хватало чтобы на графике можно было "смещение" заметить. (именно это было на картинке)

Сейчас для тестов добавил к рандому еще коефициент в виде "счетчика в квадрате" - это сильно задрало один бок и сдвинуло средне-арифметическую..

Александрович в сообщении #1539644 писал(а):
Давайте сколько есть.

Для тестов вполне хватит рандомных значений с белым шумом! Парсингом займусть только когда пойму ради чего стараюсь...

 Профиль  
                  
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 05:12 
Аватара пользователя


21/01/09
3925
Дивногорск
AndyJ в сообщении #1539645 писал(а):
=50+ROUND(50*RAND())
Это даёт равномерно распределённую дискретную св. Ну и ограничивайте слева и справа до требуемой квантили.

 Профиль  
                  
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 05:35 


04/08/20
19
Александрович в сообщении #1539647 писал(а):
Это даёт равномерно распределённую дискретную св.

В реале даже обычный рандом дает далеко не "равное распределение". Уровень погрешности даже на 49 значений дает сдвиг центра где-то между 43-56%

Александрович в сообщении #1539647 писал(а):
Ну и ограничивайте слева и справа до требуемой квантили.

Вопрос как раз и заключается в том "КАК ограничить эту квантиль?".
Есть "горизонтальная труба" на графике, заполненная случайными точками. Как выяснить насколько эту трубу нужнож сжать снизу и сверху от средне-арифметической горизонтали чтобы чтобы ниже средне-арифметической получилось 35% всех точек и выше 35% (=70%). Причем за минимальное количество "телодвижений" процессора...

 Профиль  
                  
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 06:24 
Аватара пользователя


21/01/09
3925
Дивногорск
AndyJ в сообщении #1539649 писал(а):
В реале даже обычный рандом дает далеко не "равное распределение".
Далеко это как? На каком уровне значимости проверки гипотезы о равномерности?
AndyJ в сообщении #1539649 писал(а):
даже на 49 значений дает сдвиг центра где-то между 43-56%
Вы возможно хотели сказать не о сдвиге центра распределения, а о доверительном интервале для доли в 50%?

 Профиль  
                  
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 07:46 


21/05/16
4292
Аделаида
AndyJ в сообщении #1539634 писал(а):
Хочу чтобы конечный пользователь программы (когда я ее закончу) мог бы хоть немного прогнозировать свое время, а не скучать перед монитором ожидая что "во-вот закончит" (как сейчас мучаюсь я)...

Просто выводите на экран прогресс-бар.

-- 18 ноя 2021, 14:18 --

Кстати, большинство библиотек для создания прогресс-баров ещё и ETA (примерное время для конца) выводят.

 Профиль  
                  
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 08:28 


04/08/20
19
kotenok gav в сообщении #1539658 писал(а):
Просто выводите на экран прогресс-бар.

Для интервалов больше 5-10 минут прогресс бар становится бесполезным. Даже при огромной длине ползунок движется крайне медленно чтобы мозг успевал делать прогноз. На времени больше 40 минут он визуально "висит". Можно выводить проценты с дробными, но никто не хочет считать сто значит 0.01% в 2-3 секунды.

kotenok gav в сообщении #1539658 писал(а):
Кстати, большинство библиотек для создания прогресс-баров ещё и ETA (примерное время для конца) выводят.

Во первых это обычно прогноз на основе текущей скорости. Берется например 3-5 секунд и смотрится какой % задачи выполнен. Обратным процессом получаем сколько времени на 100% и на оставшиеся %. Точность крайне хромает, если процесс не линейный. Например состоит из нескольких десятков разных операций, работающих с разными скоростями. Или на не стабильном/перегруженном интернете работать - скорость прыгает от нуля до "выше лимита за счет кеширования".

А во вторых я хочу на основе истории ПРОШЛЫХ подобных операций делать "прогноз" и "озвучивать" его пользователю. Этот прогноз не дает никаких гарантий, но надежнее простых рассчетов. И со временем "адаптируется" под текущую задачу и "обычные" условия. Если "разброс" прогноза большой, полезно озвучить диапазон, а если маленький, то можно озвучить среднее значение.

------------

Сейчас изучаю "квантиль" (СПАСИБО - термин уже давно забылся - без вас не вспомнил бы)! Вроде... похоже на то что мне нужно! В екселе почему-то крайне убогая функция, но на нормальных языках можно "точность" задавать (но их примеры в екселе уже не потестишь - нужно отдельный тестовый полигон на нормальном языке писать)

 Профиль  
                  
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 09:42 


14/02/20
863
AndyJ в сообщении #1539645 писал(а):
От синусоиды (датчик освещения на улице - в среднем 0.5 от дневной яркости)

так если синусоида, то среднее $0$ должно быть

 Профиль  
                  
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 10:00 
Аватара пользователя


21/01/09
3925
Дивногорск
AndyJ в сообщении #1539661 писал(а):
В екселе почему-то крайне убогая функция
См. там - ПРОЦЕНТИЛЬ.

 Профиль  
                  
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 10:08 


04/08/20
19
artempalkin в сообщении #1539667 писал(а):
так если синусоида, то среднее $0$ должно быть

И что? Это ведь тоже ответ на вопрос "какой ожидаемый результат?". Но меня не среднее интересует! А в каких пределах ожидается "разброс значения".
В чистой синусоиде где максимум/минимум +/-1 "ожидаемый результат" будет где-нибудь в диапазоне... +/-75-80? остальное заберет "погрешность". И =4+sin(a) это тоже синусоида, но со средним в 4. А если взять крайне маленький диапазон, то среднее может сместиться...

...начал писать полигон для отладки... с "блэкджеком" и графиками... Перенесу наработки из экселя туда.

Спасибо за ПРОЦЕНТИЛЬ! Погуглю...

Нашел несколько реализаций алгоритма для квантиля. Буду тестировать! (работы на несколько дней, а учитывая что это проект "для себя", а не для работы, то может и намного дольше)

Думаю пока вопрос можно закрыть! Если не получится, попрошу помощи еще раз!

Всем спасибо!!! :D

 Профиль  
                  
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 10:13 


14/02/20
863
AndyJ в сообщении #1539670 писал(а):
И что? Это ведь тоже ответ на вопрос "какой ожидаемый результат?". Но меня не среднее интересует! А в каких пределах ожидается "разброс значения".
В чистой синусоиде где максимум/минимум +/-1 "ожидаемый результат" будет где-нибудь в диапазоне... +/-75-80? остальное заберет "погрешность". И =4+sin(a) это тоже синусоида, но со средним в 4. А если взять крайне маленький диапазон, то среднее может сместиться...

Ну, вроде бы ваши пример был о среднем освещении на улице, а если брать его в простейшем случае, то как раз среднее есть $0$ (мне просто показалось, вы именно это хотите привести в пример. $\frac 12$ - это среднее значение не синуса, а квадрата синуса). Но пример ваш, так что если вы считаете так, то дело ваше.

 Профиль  
                  
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 18:48 
Заслуженный участник
Аватара пользователя


05/12/09
1813
Москва
AndyJ в сообщении #1539631 писал(а):
Можешь поподробнее??? Чую что алгоритм не сложный, но не знаю с чего начать...


Еще раз. Допустим, у Вас есть 100 наблюдений. Упорядочиваете их по возрастанию. Тогда 50-ое значение можно принять за "центр", диапазон на 60% - от 20-го до 80-го значения и т.д.

 Профиль  
                  
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 21:07 
Заслуженный участник


20/08/14
11790
Россия, Москва
alisa-lebovski
Медиана не всегда выдаёт наиболее вероятное значение, чего в частности хочет ТС, например для вектора $\{1,2,2,3,5,9,9,9,9\}$ медиана как легко видеть равна $5$, хотя $9$ вчетверо более вероятна.
Но здесь можно хотя бы частоты встречаемости посчитать и по ним отсортировать, а вот с $\{16,23,27,35,51,91,93,94,99\}$ это уже не проходит, повторов нет, а наиболее вероятно значение $93...94$.

 Профиль  
                  
 
 Re: Вероятность по таблице
Сообщение18.11.2021, 23:05 


04/08/20
19
Dmitriy40 в сообщении #1539748 писал(а):
например для вектора $\{1,2,2,3,5,9,9,9,9\}$

Добавьте в условие еще то что все цифры дробные с большим количеством знаков после запятой {..., 9.342, 9.423, 9.6455, 9.9984 }

Но я примерно понял направление работ! Попробую для начала на JavaScript все это из экселя перевести и на красивые графики вывести.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 29 ]  На страницу Пред.  1, 2

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group