2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4  След.
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 06:55 
Заслуженный участник
Аватара пользователя


11/03/08
9906
Москва
Я сказал бы так - для времён, когда единственные вычислительные инструменты это арифмометр и логарифмическая линейка - такой расчёт составляет "допустимый уровень халтуры". Если нет таблиц под рукой (а полноценные таблицы тяжелы, в экспедицию не возьмёшь, какой-нибудь Большев и Смирнов весит как "и Тургенева восемь томов"), то плотность распределения на логарифмической линейке посчитать можно, квадрат вообще одним движением бегунка, шкала квадратов есть, деление на два и умножение на $\log_{10} e$ два движения ползунка, переносим на шкалу логарифмов, считываем и ещё пара движений для деления на $\sqrt{2\pi}$ - вуаля! А несколько процентов погрешности простим себе. Но когда посчитать что плотность, что функцию распределения - всё в одно обращение к стандартным функциям - правильный расчёт оказывается не дороже приближённого.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 07:00 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Видимо, я недостаточно вразумительно изъясняюсь. Сорри.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 07:41 
Аватара пользователя


21/01/09
3925
Дивногорск
Otta в сообщении #1542168 писал(а):
А если жизнь сложилась так, что данные достались нам уже сгруппированными?

Тогда ничто не мешает их грамотно обработать.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 08:26 
Заслуженный участник
Аватара пользователя


11/03/08
9906
Москва
Otta в сообщении #1542168 писал(а):
Евгений Машеров в сообщении #1542164 писал(а):
Данные-то позволят всегда.

Исходные данные - позволят. А если данные достались нам уже в том виде, в котором приведены по обсуждаемой ссылке - то увы. Мы ж даже на интервалы не сможем разбить хорошо, однозначно.

Александрович в сообщении #1542167 писал(а):
Я бы сказал так: по-другому халтурно и безалаберно.
Я совершенно согласна, что не стоит группировать данные там, где в этом не было никакой нужды. И сама студентам никогда не рассказываю изложенный на сайте способ. Из вредности.
Речь не об этом. А если жизнь сложилась так, что данные достались нам уже сгруппированными?
Если что, способ этот изложен не в одном учебнике. Сайт точно не виноват.


Как раз в данном примере разбиение на интервалы точно известно. Оно приведено в первой колонке, вот если доступные данные только из второй колонки ("середины интервалов"), то можно лишь надеяться, что это действительно середины и можно восстановить границы интервалов.
Группировка, как способ облегчить расчёты, из практики заслуженно ушла. Поскольку выигрыш от неё был в том, что для человека отнести очередное значение к определённому интервалу группировки куда проще, чем сложить, тем более умножить. И при ручной обработке ускорение многократное. Но компьютер сравнение делает примерно за то же время, что и арифметические операции (а так как после сравнения нужно выполнить операцию прибавления к содержимому соответствующей ячейки, то через группировку может быть даже и дольше). Если обработка не ручная - специальная группировка бессмысленна.
Но методы обработки группированных данных изучать смысл имеет. Поскольку группировка может возникать помимо нашего желания при сборе данных. В силу, скажем, грубости измерений (вот работал когда-то с данными, снятыми 8-битным АЦП - теоретически группировка не более чем на 256 ячеек, практически, ввиду необходимости запаса на случай "зашкала" - не более сотни).
Что до претензий к сайту - да, не автор это придумал. Он не фрик, он просто халтурщик, собрав фрагменты старых учебников без осмысления, насколько они нынче актуальны.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 11:20 


03/12/21
52
Да, но задача группировки - не только облегчение расчетов.
Факт "значение лежит между 3 и 4" надежнее, чем факт "значение равно 3,15874".
Как вообще применить критерий согласия (при гипотезе непрерывного распределения) без группировки?

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 11:24 
Аватара пользователя


21/01/09
3925
Дивногорск
F111mon в сообщении #1542189 писал(а):
Как вообще применить критерий согласия (при гипотезе непрерывного распределения) без группировки?
Хи-квадрат никак. Применяйте критерий Колмогорова.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 11:28 
Заслуженный участник
Аватара пользователя


11/03/08
9906
Москва
F111mon в сообщении #1542189 писал(а):
Как вообще применить критерий согласия (при гипотезе непрерывного распределения) без группировки?


Не все критерии согласия - $\chi^2$

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 16:23 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Евгений Машеров в сообщении #1542175 писал(а):
Как раз в данном примере разбиение на интервалы точно известно

Да. Дело в том, что на указанной Вами странице примера два. Считаются они там одинаково. Но первый - дан уже группированным. А второй - изначально не был таким. Я комментировала второй. Вы первый.
В первом, разумеется, нужна функция распределения. Там вполне всего достаточно. Данных в том числе. Они сразу в нужном виде.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 22:10 
Заслуженный участник
Аватара пользователя


11/03/08
9906
Москва
Если Вы про "пример 20", то в таблице границы интервалов не указаны, но из гистограммы они прекрасно видны. Целые числа.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 22:56 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Да, про него. Если что, его формулировка тут: http://www.mathprofi.ru/asimmetriya_i_excess.html Изначально выборка не группирована вообще.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение10.12.2021, 06:40 
Заслуженный участник
Аватара пользователя


11/03/08
9906
Москва
А это уже другой вопрос - стоит ли применять $\chi^2$ для проверки нормальности. Есть и другие критерии. Разбиение на интервалы это потеря информации. Может быть, оставить его для дискретных величин, скажем, для таблиц сопряжённости, а нормальность проверять иначе?
Если данные изначально группированы, и в другом виде недоступны, это одно. А начинать с устранения части информации - зачем? Когда это было приёмом сокращения трудоёмкости ручных вычислений, это было неизбежно. А сейчас?

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение10.12.2021, 07:11 
Аватара пользователя


21/01/09
3925
Дивногорск
Евгений Машеров в сообщении #1542271 писал(а):
А начинать с устранения части информации - зачем?
Начинать с этого конечно не стоит. А уж если делать расчёты дисперсии и эксцесса по интервальному ряду, то нужно было бы учесть поправки Шеппарда. А если находить моду, то это только в случае интервального представления.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение10.12.2021, 10:13 
Заслуженный участник
Аватара пользователя


11/03/08
9906
Москва
А тут встаёт вопрос, надо ли находить значение моды в выборке из непрерывного распределения. Или лучше оставить её, как чисто теоретическую величину, без выхода в численные значения.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение10.12.2021, 10:40 
Аватара пользователя


21/01/09
3925
Дивногорск
Евгений Машеров в сообщении #1542286 писал(а):
А тут встаёт вопрос, надо ли находить значение моды в выборке из непрерывного распределения.

Если такой задачи не стоит, то не надо. А если такая задача поставлена?

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение10.12.2021, 11:47 
Заслуженный участник
Аватара пользователя


11/03/08
9906
Москва
Как учебная или как прикладная?
Как учебная - могу лишь посочувствовать и посоветовать делать точно так, как в методичке.

(Оффтоп)

Люминь значит люминь!

А если это реальная задача - наверно, лучше подобрать соответствующее распределение, отыскать его параметры и для него найти моду. А не нарезать выборку, вместо колбасы.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 55 ]  На страницу Пред.  1, 2, 3, 4  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: Pythagoras


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group