Задача из прикладной области (анализ данных и машинное обучение), ниже напишу, откуда она возникла.
Условие.
1. Есть два случайных вектора, нужно проверить следующую гипотезу - правда ли, что второй является некоторой функцией от первого (то есть, правда ли, что данные, которые нам даёт второй вектор, новые).
Если вектора одномерные, можно считать корреляцию и смотреть, насколько она близка к нулю (но тут есть непонятный для меня момент, если я правильно помню курс статистики, то равенство корреляции
означает наличие линейной зависимости, но с точки зрения практики, наличие другой зависимости тоже означает, что второй вектор не привносит новой информации, например, если
, то
полностью выражается через
, и поэтому не даёт ничего нового, хотелось бы такие зависимости тоже отслеживать).
Для неодномерных векторов я пока не совсем представляю, как действовать.
2. Аналогично (1), но есть набор векторов
, проверяется гипотеза
, то есть опять же, правда ли, что по векторам
в некотором смысле можно определить
.
В обоих пунктах (1 и 2) можно подсчитать матрицу ковариаций и как-то её анализировать, но во-первых, я не очень понимаю, как именно следует её анализировать, а во-вторых, проблема из п.1 остаётся, может так получиться, что этот анализ даст информацию лишь наличии линейной зависимости.
Что можно сделать для этих задач?
Привожу, откуда задачи взялись, может быть я вообще не тем путём пошёл.
Есть некоторая задача детекции, которую мы пытаемся решить при помощи нейронных сетей (некоторый её частный случай успешно решается нейронными сетями, поэтому есть надежда, что этот случай тоже поддаётся аналогичным методам). В этой задаче изначально на входе была одна картинка (матрица с элементами 0-255), на выходе матрица вероятностей наличия детектируемого объекта (элементы 0-1).
В частном случае этого хватило для детекции, в обобщённом выяснилось, что этой картинки не хватает (эта картинка на самом деле просто медицинский снимок), и было решено добавить новые данные - ещё одна матрица того же размера с элементами 0-255 (это уже не снимок, это некоторая характеристика, её суть для математики не очень важна). Был подготовлен большой датасет с поворотами, но обученная по нему модель не детектирует нужный объект.
В попытках установить причину фейла возникли два предположения. Первое - возможно вторая матрица является (почти) функцией от первой матрицы и реально не даёт новых данных (это задача (1) выше), хочется это как-то проверить. Второе - общий вопрос, а можно ли эту задачу детекции решить по этим данным, это задача (2) выше, грубо говоря, правда ли, что векторы вероятностей (из датасета) сильно коррелируют с набором векторов входа (пара описанных матриц). Но тут проблема - нейронная сеть представляет собой нелинейную функцию, я не уверен, но возможно тут корреляционный анализ совершенно не подходит.
Буду благодарен за любую полезную информацию.