Простите.
Нужно решить задачу прогнозирования. Имеется временной ряд, состоящий из 0 и 1. Длинной 400-500 значений. Нужно делать прогноз так, чтоб совпадение прогноза с текушим процессом было не меньше 50%. Так же важна плотность, т.е. равномерное распределение 0 и 1 в верном прогнозе. 0101010101 или 010010110110010100. 0000001101111111 - не годиться из-за длинной (условно) серии нулей.
Взял окно шириной 18 значений. Посчитал плотность - количество единиц в отрезке / на 18. Сместился на шаг вперёд... Прошел весь ряд. Взял медиану. Получилось 0.29. Дальше плотность i-го отрезка / 0.29
Построил график. На рисунке верхний. Степень отклонения i-того от среднего. Синусоидой конечно не пахнет.
Дальше расссуждал так. Жду максимума отклонения величины вниз - плотность ниже средней. Должна пойти компенсация - единицы пойдут чаще.
Кроме того окно разделил пополам. Сделал второй график - отношение количества единиц в левой (дальней от прогноза) половине к количеству единиц во всём окне. Т.е. плотность внутри отрезка. Предположил, что если первый график ушел вниз, а второй - вверх, то стало быть единиц в отрезке стало меньше среднего и сконцентрированы они в левой части. Хвост временного ряда стало быть жиденький. Почти всё нули. Должны жирно пойти единицы. Не получается! В прогнозе тоже распределение 0.29
Как быть?
Прогноз на выборочных участках тоже годиться. Главное, чтоб точность была. Подскажите пожалуйста как это решается