2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки


Правила форума


Посмотреть правила форума



Начать новую тему Ответить на тему
 
 Задача проверки гипотезы
Сообщение06.04.2025, 19:18 


21/11/23
20
Инвестор Глупов, следуя разработанной им стратегии торговли, после полугода игры на бирже обнаружил, что прибыль, получаемая им по итогам каждого дня, различается. Он смог разделить все дни по единому формальному критерию на:
1. Удачные
2. Нейтральные
3. Неудачные

После чего просуммировал (сгруппировал) полученную им прибыль по каждому из типов дней. Это дало следующую разбивку:
1. Удачные дни принесли ему 80% суммарной прибыли
2. Нейтральные дни принесли 30% прибыли
3. Неудачные дни принесли 10% убытка.
Суммарно 100%.

Далее инвестор хочет оценить вероятность того, что полученное им распределение прибыли по типам дней есть результат случайного совпадения, а не следования разработанной им стратегии торговли. Дабы принимать дальнейшие решения, опираясь на количественные оценки.
Вопрос: можно ли посчитать эту вероятность, используя приведенные цифры? Для простоты будем считать, что количество дней каждого типа одинаково и равняется 60 (в сумме 180).

Если задача сформулирована некорректно, подскажите, поправлю.
Спасибо заранее всем откликнувшимся.

 Профиль  
                  
 
 Re: Задача проверки гипотезы
Сообщение07.04.2025, 03:49 
Аватара пользователя


21/01/09
3948
Дивногорск
Alex2718281828 в сообщении #1681330 писал(а):
полученное им распределение прибыли по типам дней есть результат случайного совпадения

Проверить гипотезу по критерию хи-квадрат.

 Профиль  
                  
 
 Re: Задача проверки гипотезы
Сообщение07.04.2025, 08:22 
Заслуженный участник
Аватара пользователя


11/03/08
10204
Москва
Ну, я бы начал с чёткой формулировки гипотезы. Ну и прояснить - "удачные", "нейтральные" и "неудачные" как выделены? Если по прибыльности (скажем, прибыль выше порогового значения - удачные, прибыль есть, но ниже порога - нейтральные, убыток - неудачные), то никакой информации об успешности стратегии получить нельзя. Поскольку при любой стратегии, даже босании монетки, прибыль при выделенных так "удачных" будет выше порога, "нейтральных" между нулём и порогом, "неудачных" - убыток). Можно сравнивать дни, когда торговали "по стратегии" и "не по стратегии" (или - "контрарно стратегии"), или же сравнивать успешность Вашей торговли только по стратегии с чужой, где Ваша стратегия не используется.

 Профиль  
                  
 
 Re: Задача проверки гипотезы
Сообщение07.04.2025, 16:14 


21/11/23
20
Евгений Машеров в сообщении #1681369 писал(а):
Ну, я бы начал с чёткой формулировки гипотезы.

Нет, все по-честному. Критерий разделения дней по типам никак с прибыльностью не связан. Если Вам нужна конкретика, используйте простой алгоритм:
1. Удачными считаются дни любого месяца, порядковый номер которых описывается формулой 3*n, где n - натуральное число
2. Нейтральными считаются дни любого месяца, порядковый номер которых описывается формулой 3*n-1, где n - натуральное число
3. Неудачными считаются дни любого месяца, порядковый номер которых описывается формулой 3*n-2, где n - натуральное число
поэтому никакой подтасовки задним числом.

Александрович в сообщении #1681361 писал(а):
Проверить гипотезу по критерию хи-квадрат.

Пожалуй, да. Пойду погружаться в тему хи-квадрат. Ни черта уже не помню :facepalm:
- Площадь круга, площадь круга... два пи эр.
- Что Вы кончили подруга?
- АПН...
(с)
Искреннее спасибо

 Профиль  
                  
 
 Re: Задача проверки гипотезы
Сообщение07.04.2025, 20:34 
Заслуженный участник
Аватара пользователя


11/03/08
10204
Москва
Тогда просто. Рисуем табличку 3х3, по одной оси "удачность дня" - удачный, нейтральный, неудачный. По другой оси дни высокоприбыльные, низкоприбыльные, убыточные. Отмечаем попадания в ячейки. Считаем статистику $\chi^2$ и сравниваем с критическим значением.

 Профиль  
                  
 
 Re: Задача проверки гипотезы
Сообщение07.04.2025, 21:44 


21/11/23
20
Евгений Машеров в сообщении #1681416 писал(а):
Тогда просто. Рисуем табличку 3х3, по одной оси "удачность дня" - удачный, нейтральный, неудачный. По другой оси дни высокоприбыльные, низкоприбыльные, убыточные. Отмечаем попадания в ячейки. Считаем статистику $\chi^2$ и сравниваем с критическим значением.

По оси Х типы дней, понятно. А почему по Y тоже только 3 строки? Дней много больше 3х. И строго говоря, они следуют не строго циклично друг за другом. Если сгруппировать их, чтобы цикличность соблюдалась, получится вот такая табличка из 25 интервалов времени. В каждой ячейке полученный в течение этого времени результат.

Номер Прирост по интервалам
тройки Тип 1 Тип 2 Тип 3
1 0.2218% 0.4752% 0.4752%
2 0.1985% 1.0398% 0.2011%
3 7.2148% 6.2390% 0.4259%
4 10.3613% 6.6396% 7.0920%
5 44.1293% 0.7770% 15.8367%
6 3.9763% 12.8778% 4.3937%
7 0.9653% -0.4924% -4.7149%
8 8.4973% 0.0000% -31.4111%
9 4.5808%
Итого: 80.1454% 27.5560% -7.7013%

Сорри, на я форуме нуб, таблица криво получилась

 Профиль  
                  
 
 Re: Задача проверки гипотезы
Сообщение07.04.2025, 22:11 
Заслуженный участник
Аватара пользователя


11/03/08
10204
Москва
Потому, что тоже три категории. А "много" - значит, в ячейке будет много наблюдений.

 Профиль  
                  
 
 Re: Задача проверки гипотезы
Сообщение07.04.2025, 22:33 


21/11/23
20
Евгений Машеров в сообщении #1681424 писал(а):
Потому, что тоже три категории. А "много" - значит, в ячейке будет много наблюдений.

Эммм, я не очень понимаю, по какому объективному критерию следует делить дни на "высокоприбыльные, низкоприбыльные, убыточные"? Очень большой диапазон для произвола автора

 Профиль  
                  
 
 Re: Задача проверки гипотезы
Сообщение08.04.2025, 01:08 
Аватара пользователя


21/01/09
3948
Дивногорск
Alex2718281828 в сообщении #1681401 писал(а):
Пойду погружаться в тему хи-квадрат. Ни черта уже не помню

См. также критерий согласия Пирсона.

 Профиль  
                  
 
 Re: Задача проверки гипотезы
Сообщение08.04.2025, 09:21 
Заслуженный участник
Аватара пользователя


11/03/08
10204
Москва
Цикличность здесь совершенно не существенна, она появилась в связи с вопросом, определяется ли "удачность/неудачность" дня по результатам торговли или на основании независимого от результатов критерия. Важно, чтобы было ясно, какие значения соотносятся с какими днями. Если полагать, что в каждом ряду последовательно удачные, нейтральные и неудачные (опять же, это Ваша терминология), то получаем, используя ли ANOVA или непараметрический тест Крускала-Уоллеса, отсутствие значимых различий. Видимое несоответствие тому, что подсчёт суммарной доходности показывает существенные различия, проясняется картинкой
Вложение:
Boxplot by Group.jpg
Boxplot by Group.jpg [ 27.08 Кб | Просмотров: 0 ]

Здесь прямоугольник ("ящик") показывает разброс половины наблюдений, близких к медиане (точка в прямоугольнике), а "усы" это максимум и минимум, и видно, что в первой группе есть один очень большой выброс вверх (44.1293%), а в третьей выброс вниз (-31.4111%), что и обуславливает "высокую доходность" первой и "убыточность" второй группы. Но единичные явления такого рода, скорее всего, случайны.

 Профиль  
                  
 
 Re: Задача проверки гипотезы
Сообщение08.04.2025, 14:07 


21/11/23
20
Евгений Машеров в сообщении #1681446 писал(а):
Здесь прямоугольник ("ящик") показывает разброс половины наблюдений, близких к медиане (точка в прямоугольнике), а "усы" это максимум и минимум, и видно, что в первой группе есть один очень большой выброс вверх (44.1293%), а в третьей выброс вниз (-31.4111%), что и обуславливает "высокую доходность" первой и "убыточность" второй группы. Но единичные явления такого рода, скорее всего, случайны.

Спасибо, вот теперь логику понял. По сути рассчитываем доверительные интервалы по Стьюденту, и если они перекрывают друг друга, то с заданной достоверностью гипотезу считаем ложной.
Реальные средние на самом деле заметно различаются друг от друга, потому как прибыль для каждой точки получена на разной величине активов. Один рубль, заработанный на вложенных 100 и тот же рубль, заработанный на вложенных 10 - это два разных рубля. Хотя расплачиваемся и тем и другим в магазине одинаково.
Я пересчитал таблицу с учетом размера активов на начало каждого интервала, и средние действительно стали заметно отличаться друг от друга. Но стандартные отклонения по-прежнему велики.

Изображение

Надо признаться, в этих данных к великому сожалению сидит еще одна (неявная) регулярная составляющая. А критерий Стьюдента, как известно, требует нормального распределения относительно среднего. Поэтому мне надо подумать, как лучше ее скомпенсировать, чтобы можно было работать дальше.
Когда сделаю, напишу, что получилось.

 Профиль  
                  
 
 Re: Задача проверки гипотезы
Сообщение08.04.2025, 14:58 
Заслуженный участник
Аватара пользователя


11/03/08
10204
Москва
ANOVA (которая не Стьюдент, но близко по концепции) не показывает значимой разницы, поскольку среднее выбросами сильно смещено, но при этом и дисперсия драматически возрастает, а она в знаменателе.
А Краскелл-Уоллес непараметрический, к выбросам более устойчив и опирается на медиану, то есть выбросы на него мало влияют.

 Профиль  
                  
 
 Re: Задача проверки гипотезы
Сообщение08.04.2025, 18:51 


21/11/23
20
Евгений Машеров в сообщении #1681497 писал(а):
ANOVA (которая не Стьюдент, но близко по концепции) не показывает значимой разницы, поскольку среднее выбросами сильно смещено, но при этом и дисперсия драматически возрастает, а она в знаменателе.
А Краскелл-Уоллес непараметрический, к выбросам более устойчив и опирается на медиану, то есть выбросы на него мало влияют.

Посчитал по Краскеллу-Уоллесу. Суммы рангов по типам недостаточно отличаются друг от друга (как понимаю, для подтверждения гипотезы крайние суммы должны отличаться раза в три). Значит исходная гипотеза неверна.
Но нет худа без добра, по показателю Нэмп. можно хотя бы для себя сравнивать эффективность разных критериев деления на группы. Лично для меня это новый опыт. Теперь понимаю, какие еще критерии следует испытать.
Спасибо огромное :appl:

Изображение

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 13 ] 

Модераторы: Модераторы Математики, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group