2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Полигон частот для непрерывного распределения
Сообщение25.11.2024, 01:14 


26/02/24
12
Что будет, если построить полигон частот для непрерывного распределения, как для дискретного (то есть каждому значению выборки будет соответствовать его частота встречаемости в этой выборке)?
Построив график на Питоне, я получила прямую линию со значением $\frac{1}{size}$ ($size$ - размер выборки), то есть такое значение соответствует каждому значению выборки (я попробовала сделать это для равномерного непрерывного и нормального распределений). Я думаю, что такая ситуация будет складываться при любом непрерывном распределении (потому что значения разбрасываются с одинаковой вероятностью и их бесконечно много на интервале), однако два вопроса моего преподавателя заставили меня сомневаться в полученных мною результатах:
1) "Разве всегда будет прямая линия?"
2) "Когда можно/применимо строить полигон частот для непрерывного распределения именно так, как описано выше, а не как это делается обычно (строится линия, соединяющая середины столбцов гистограммы)?"
Помогите, пожалуйста, разобраться с вопросами (особенно с первым, так как второй вопрос, думаю, вытекает из первого). Просто мне кажется, что описанная мною ситуация верна для любого непрерывного распределения, однако вопрос преподавателя заставил меня в этом сомневаться, к сожалению.

 Профиль  
                  
 
 Re: Полигон частот для непрерывного распределения
Сообщение25.11.2024, 01:20 
Аватара пользователя


22/11/22
624
А как преподаватель вообще отнесся к идее строить полигон для непрерывного распределения?
moonruleni9ne в сообщении #1662766 писал(а):
Построив график на Питоне, я получила прямую линию со значением $\frac{1}{size}$

то есть $y=1/n$?

 Профиль  
                  
 
 Re: Полигон частот для непрерывного распределения
Сообщение25.11.2024, 08:31 


26/02/24
12
Combat Zone в сообщении #1662767 писал(а):
то есть $y=1/n$?

Да, то есть каждое значение имеет такую частоту, то есть встретилось в выборке по одному разу.

 Профиль  
                  
 
 Re: Полигон частот для непрерывного распределения
Сообщение25.11.2024, 09:54 
Заслуженный участник
Аватара пользователя


11/03/08
9907
Москва
Для непрерывного распределения предложенный график будет отличен от прямой, если какие-то значения повторяются. Для широко употребительных распределений (нормальное, равномерное, экспоненциальное...) такая ситуация не невозможна, но вероятность стремится к нулю ("множество меры нуль"). Распределение, для которого это не так, придумать можно, но это будет несколько искусственно. Скажем, случайная величина с вероятностью 50% принимает значение 0, и 50% - равна нормально распределённой величине с нулевым средним (либо у нас данные заведомо точные, либо точные недоступны, и мы измеряем, внося ошибку измерения). Или - у пациента скорее всего нет опухоли, размер пишем 0, но если она есть - размер имеет логнормальное распределение. То есть это некая композиция из дискретного и непрерывного распределения, но формально оно непрерывное.
Другая ситуация, при которой возможен смысл в построении полигона для непрерывного распределения - если оно формально непрерывное, но представлено нам в виде измерений с довольно грубой шкалой. Соответственно, вероятность того, что несколько измерений окажутся равны (с доступной нам точностью) ненулевая. Но по сути это означает, что мы пользуемся гистограммой, только шаг и начальный отсчёт выбраны не нами.
Задача - представить непрерывное распределение графически, и чтобы график был "плавный" - востребована, но общепринятого подхода нет. Один вариант - использовать подгонку распределением, которое при различных значениях параметров может соответствовать встречающимся в нашей задаче распределениям (скажем, есть система кривых Пирсона, в которых оценивают, помимо среднего и дисперсии, также асимметрию и эксцесс, вычисляют параметры дифуравнения для плотности распределения, и в зависимости от этих параметров получают 12 вариантов, среди которых бета-, гамма-, Стьюдента, равномерное, нормальное, показательное и несколько не имеющих собственных названий; и рисуют плотность распределения для оценённой кривой). Другой вариант - непараметрические "ядерные оценки", в которых каждый отсчёт выборки как бы "размывают", используя ядро (например, выбирая ядро гауссианом).

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 4 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group