Общий подход обычно такой:
1. Есть ли какие-нибудь теоретические предположения о характере зависимости?
2. Эмпирические предположения о характере зависимости: строим график и внимательно на него смотрим, на какую кривую оно похоже. Выбираем параметризованное семейство функций, с помощью которых будем аппроксимировать график. Например, если на графике видны периодические колебания, то логично в качестве семейства функций брать синусы и косинусы; если на графике есть резкий рост, то можно брать степенные функции или экспоненту.
3. Загоняем данные в статистический пакет (например, Statistika), задаем вид зависимости. Программа рассчитывает параметры аппроксирующей кривой, минимизируя некоторую т.н. функцию потерь. В классическом случае минимизируется сумма квадратов отклонений эмпирических данных от теоретической кривой, но можно задавать и другие функции риска.
4. Стат. пакет вместе со значениями параметров строит нам график теоретической кривой и эмпирических данных. Внимательно смотрим на этот график и отвечаем на два вопроса:
1) правильно ли подобран вид теоретической (аппроксимирующей) функции? Иногда можно выделить несколько интервалов, на каждом из которых будет своя аппроксимирующая функция.
2) можно ли, исключив некоторые наблюдения, далеко отстоящие от аппроксимирующей функции, повысить точность аппроксимации? Скажем, мы исключаем 5% наблюдений, считая их случайными флуктуациями, и от этого точность повышается (значение функции потерь сильно уменьшается).
Добавлено спустя 7 минут 38 секунд: