О боже... Записываете ваши данные в файлик, но в конце добавляете единичку. Пакуете этот файлик любым подходящим архиватором (хоть gzip, хоть winrar, правда последним я не пробовал). Замеряете размер архива в байтах. Теперь опять лезете в исходный файлик, меняете добавленную единичку на ноль и снова пакуете и замеряте размер. Если в первом случае размер будет меньше, значит следующим битом должна быть единица, иначе -- ноль. :)
Мне помог пользователь параллельного форума, за что ему огромное спасибо.
Немного поэкспериментировал на присланных мне данных.
Попробовал посжимать разными способами. Замечательно сжимает раз в 5-6. Но никаких особых зависимостей оно не нашло.
Попробовал статистику получить, в том числе по подряд идущим группам цифр (от 1 до 20 подряд со сдвигами, с разными шагами). Группы, длиной больше 20 изучать тяжеловато, плюс, начиная с 10 они становятся практически равномерно распределенными.
По результатам экспериментирования у меня процент правильных предсказаний около 50-60% на окне в 500 последовательных точек (угадал или не угадал =) ). Если брать всю последовательность, результат получается в районе 50%, так что, к сожалению, мне не удалось найти какую-либо явную зависимость. Если ее внимательно изучить, то получится на самом деле, что данная последовательность состоит из подпоследовательностей (см картинки ниже) ( приблизительно 0-600, 600-1100, 1100-2200, 2200-2880). Если по группам, то результат дает в районе 60% (что не легче)
Пробовал еще моделировать ядрами Винера-Вольтерра. Но опять же они не для бинарных данных. Еще пробовал по системам с памятью на основах этих ядер - результат аналогичен. Алгоритм Берлекэмпа-Мэсси тоже отправился в топку. Всякие вкусные корреляции поехали следом, так как мы получаем значения вроде 0,05+-0,1. К сожалению больше мне ничего не удалось припомнить.
На закусь.
График 1.
http://i51.tinypic.com/15fksuc.pngВизуализация по данным. Как вы понимаете 0 и 1 показывать на графике бесполезно. Поэтому я сделал небольшое отображение и просуммировал, где 0 это -0,5, а 1 это +0,5.
Получилось интересный график суммы. Можно еще попробовать поисследовать его. Разложить например по частотам, сделать какое-нибудь сглаживание, но тогда мы уже будем не нули и единицы предсказывать, а поведение этого графика, что не есть хорошо.
График 2.
http://i56.tinypic.com/17rfyb.pngВизуализация по первым девяти группам цифр. По оси ординат частота той или иной группы деленная на максимальную, по оси абсцисс, числа, соответствующие последовательностям в двоичной системе счисления (например 23 это 10111).
При взгляде на вторую картинку меня не оставляла мысль, что там фрактал или что-то подобное лежит в основе.
Т.е что-то уже можно исключить. Какие ещё варианты ?