2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему На страницу Пред.  1, 2, 3, 4  След.
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 06:55 
Заслуженный участник
Аватара пользователя


11/03/08
10033
Москва
Я сказал бы так - для времён, когда единственные вычислительные инструменты это арифмометр и логарифмическая линейка - такой расчёт составляет "допустимый уровень халтуры". Если нет таблиц под рукой (а полноценные таблицы тяжелы, в экспедицию не возьмёшь, какой-нибудь Большев и Смирнов весит как "и Тургенева восемь томов"), то плотность распределения на логарифмической линейке посчитать можно, квадрат вообще одним движением бегунка, шкала квадратов есть, деление на два и умножение на $\log_{10} e$ два движения ползунка, переносим на шкалу логарифмов, считываем и ещё пара движений для деления на $\sqrt{2\pi}$ - вуаля! А несколько процентов погрешности простим себе. Но когда посчитать что плотность, что функцию распределения - всё в одно обращение к стандартным функциям - правильный расчёт оказывается не дороже приближённого.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 07:00 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Видимо, я недостаточно вразумительно изъясняюсь. Сорри.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 07:41 
Аватара пользователя


21/01/09
3929
Дивногорск
Otta в сообщении #1542168 писал(а):
А если жизнь сложилась так, что данные достались нам уже сгруппированными?

Тогда ничто не мешает их грамотно обработать.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 08:26 
Заслуженный участник
Аватара пользователя


11/03/08
10033
Москва
Otta в сообщении #1542168 писал(а):
Евгений Машеров в сообщении #1542164 писал(а):
Данные-то позволят всегда.

Исходные данные - позволят. А если данные достались нам уже в том виде, в котором приведены по обсуждаемой ссылке - то увы. Мы ж даже на интервалы не сможем разбить хорошо, однозначно.

Александрович в сообщении #1542167 писал(а):
Я бы сказал так: по-другому халтурно и безалаберно.
Я совершенно согласна, что не стоит группировать данные там, где в этом не было никакой нужды. И сама студентам никогда не рассказываю изложенный на сайте способ. Из вредности.
Речь не об этом. А если жизнь сложилась так, что данные достались нам уже сгруппированными?
Если что, способ этот изложен не в одном учебнике. Сайт точно не виноват.


Как раз в данном примере разбиение на интервалы точно известно. Оно приведено в первой колонке, вот если доступные данные только из второй колонки ("середины интервалов"), то можно лишь надеяться, что это действительно середины и можно восстановить границы интервалов.
Группировка, как способ облегчить расчёты, из практики заслуженно ушла. Поскольку выигрыш от неё был в том, что для человека отнести очередное значение к определённому интервалу группировки куда проще, чем сложить, тем более умножить. И при ручной обработке ускорение многократное. Но компьютер сравнение делает примерно за то же время, что и арифметические операции (а так как после сравнения нужно выполнить операцию прибавления к содержимому соответствующей ячейки, то через группировку может быть даже и дольше). Если обработка не ручная - специальная группировка бессмысленна.
Но методы обработки группированных данных изучать смысл имеет. Поскольку группировка может возникать помимо нашего желания при сборе данных. В силу, скажем, грубости измерений (вот работал когда-то с данными, снятыми 8-битным АЦП - теоретически группировка не более чем на 256 ячеек, практически, ввиду необходимости запаса на случай "зашкала" - не более сотни).
Что до претензий к сайту - да, не автор это придумал. Он не фрик, он просто халтурщик, собрав фрагменты старых учебников без осмысления, насколько они нынче актуальны.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 11:20 


03/12/21
54
Да, но задача группировки - не только облегчение расчетов.
Факт "значение лежит между 3 и 4" надежнее, чем факт "значение равно 3,15874".
Как вообще применить критерий согласия (при гипотезе непрерывного распределения) без группировки?

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 11:24 
Аватара пользователя


21/01/09
3929
Дивногорск
F111mon в сообщении #1542189 писал(а):
Как вообще применить критерий согласия (при гипотезе непрерывного распределения) без группировки?
Хи-квадрат никак. Применяйте критерий Колмогорова.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 11:28 
Заслуженный участник
Аватара пользователя


11/03/08
10033
Москва
F111mon в сообщении #1542189 писал(а):
Как вообще применить критерий согласия (при гипотезе непрерывного распределения) без группировки?


Не все критерии согласия - $\chi^2$

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 16:23 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Евгений Машеров в сообщении #1542175 писал(а):
Как раз в данном примере разбиение на интервалы точно известно

Да. Дело в том, что на указанной Вами странице примера два. Считаются они там одинаково. Но первый - дан уже группированным. А второй - изначально не был таким. Я комментировала второй. Вы первый.
В первом, разумеется, нужна функция распределения. Там вполне всего достаточно. Данных в том числе. Они сразу в нужном виде.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 22:10 
Заслуженный участник
Аватара пользователя


11/03/08
10033
Москва
Если Вы про "пример 20", то в таблице границы интервалов не указаны, но из гистограммы они прекрасно видны. Целые числа.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение09.12.2021, 22:56 
Заслуженный участник


09/05/13
8904
∞⠀⠀⠀⠀
Да, про него. Если что, его формулировка тут: http://www.mathprofi.ru/asimmetriya_i_excess.html Изначально выборка не группирована вообще.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение10.12.2021, 06:40 
Заслуженный участник
Аватара пользователя


11/03/08
10033
Москва
А это уже другой вопрос - стоит ли применять $\chi^2$ для проверки нормальности. Есть и другие критерии. Разбиение на интервалы это потеря информации. Может быть, оставить его для дискретных величин, скажем, для таблиц сопряжённости, а нормальность проверять иначе?
Если данные изначально группированы, и в другом виде недоступны, это одно. А начинать с устранения части информации - зачем? Когда это было приёмом сокращения трудоёмкости ручных вычислений, это было неизбежно. А сейчас?

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение10.12.2021, 07:11 
Аватара пользователя


21/01/09
3929
Дивногорск
Евгений Машеров в сообщении #1542271 писал(а):
А начинать с устранения части информации - зачем?
Начинать с этого конечно не стоит. А уж если делать расчёты дисперсии и эксцесса по интервальному ряду, то нужно было бы учесть поправки Шеппарда. А если находить моду, то это только в случае интервального представления.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение10.12.2021, 10:13 
Заслуженный участник
Аватара пользователя


11/03/08
10033
Москва
А тут встаёт вопрос, надо ли находить значение моды в выборке из непрерывного распределения. Или лучше оставить её, как чисто теоретическую величину, без выхода в численные значения.

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение10.12.2021, 10:40 
Аватара пользователя


21/01/09
3929
Дивногорск
Евгений Машеров в сообщении #1542286 писал(а):
А тут встаёт вопрос, надо ли находить значение моды в выборке из непрерывного распределения.

Если такой задачи не стоит, то не надо. А если такая задача поставлена?

 Профиль  
                  
 
 Re: Вопрос по критерию согласия Пирсона (хи-квадрат)
Сообщение10.12.2021, 11:47 
Заслуженный участник
Аватара пользователя


11/03/08
10033
Москва
Как учебная или как прикладная?
Как учебная - могу лишь посочувствовать и посоветовать делать точно так, как в методичке.

(Оффтоп)

Люминь значит люминь!

А если это реальная задача - наверно, лучше подобрать соответствующее распределение, отыскать его параметры и для него найти моду. А не нарезать выборку, вместо колбасы.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 55 ]  На страницу Пред.  1, 2, 3, 4  След.

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group