Хочу представить Вам для обсуждения регрессионную модель, которая расширяет метод наименьших квадратов Гаусса (МНК) в нелинейную область.
РМС поможет исследователям в поиске закономерностей, которые могут быть в исходном ряде чисел, примерно так-же как огромный вклад вносит МНК, в случае поиска линейных закономерностей, а РМС значительно расширяет этот популярный метод в нелинейную область.
Надеюсь в ходе обсуждения, поддержки и/или конструктивной критики, практики получат новый мощный метод анализа фактических данных на предмет поиска закономерностей в исходном ряде чисел, подобный МНК Гусса, но охватывающий и нелинейную область.
Буду признателен помощи, советам, замечаниям и конструктивной критике со стороны участников форума.
РМС имеет следующий вид:
где:
- интегральная функция Гамма-распаределения Эйлера;
- постоянные коэффициенты;
- параметры интегральной функции Гамма- распределения Эйлера.
Способы определения коэффициентов РМС и параметров Гамма-распределения приведены в статье
http://www.mql5.com/ru/articles/250.
Описание метода:
Если имеется массив исходных данных
в зависимости от соответствующих значений переменной
в количестве не менее 3-х пар значений, то определив коэффициенты и параметры, указанным в статье способом, можно получить регрессионное уравнение в вышеприведенном виде, описывающее поведение функции
в зависимости от переменной
.
Допустим. имеются
пар исходных значений
при соответствующих значениях
.
Определяем параметры
,
Гамма-распределения и коэффициенты
,
РМС полученными и предложенными мною способами и впервые опубликованные в вышеуказанной статье в виде соотношений (12-17). Сама РМС приведена в виде формулы (18).
Здесь
http://forum.mql4.com/ru/50108 приведены конкретные примеры описания с помощью РМС линейной и тригонометрической зависимостей (на примере тангенса). Здесь
http://forum.mql4.com/ru/50108/page3 показаны как охватывает РМС квадратичную и гиперболическую зависимости, а здесь
http://forum.mql4.com/ru/50108/page20 - экспоненциальную зависимость.
В настоящее время РМС применяется в теле различных индикаторов финансовых рынков с целью описания истории и возможного прогнозирования поведения временного ряда в будущем
http://codebase.mql4.com/ru/7638,
http://forum.mql4.com/ru/38834.
Однако, на практике редко встречаются случаи, когда процесс описывается функцией определенного вида с одним переменным. Чаще имеем дело с осложненными ситуациями, когда изучаемый объект описывается нелинейной и/или неизвестной закономерностью в зависимости от множества, порой трудно учитываемых и труднооцениваемых, переменных.
Рассмотрим, в качестве примера, динамику изменения количества населения Республики Таджикистан за 1991-2010 гг. (тыс. чел.) и попробуем найти эту закономерность с помощью РМС и линейной зависимости. Результаты приведены в таблице:
Код:
годы x y РМС ЛР
1991 0 5505,6 5505,6 5279,6
1992 1 5567,2 5535,7 5397,7
1993 2 5579,7 5588,2 5515,8
1994 3 5633,8 5654,7 5633,9
1995 4 5701,4 5732,2 5752,1
1996 5 5769,1 5819,1 5870,2
1997 6 5875,8 5914,2 5988,3
1998 7 6001,3 6016,7 6106,4
1999 8 6126,7 6125,9 6224,5
2000 9 6250,0 6241,4 6342,6
2001 10 6375,5 6362,7 6460,7
2002 11 6506,5 6489,4 6578,8
2003 12 6640,0 6621,3 6696,9
2004 13 6780,4 6758,1 6815,0
2005 14 6920,3 6899,5 6933,1
2006 15 7063,8 7045,4 7051,2
2007 16 7215,7 7195,5 7169,3
2008 17 7373,8 7349,6 7287,4
2009 18 7529,6 7507,7 7405,5
2010 19 7616,4 7669,5 7523,6
128032,6 128032,6 128032,6
Получены следующие уравнения регрессии:
при относительной ошибке 0,40%;
при относительной ошибке 1,52%.
Изменение ВВП республики за период с 2004-2010г.г. (в млн. сомони) можно выразить следующими зависимостями с помощью РМС и линейной модели:
Код:
годы x y РМС ЛР
2004 0 6167,2 6167,2 4347,5
2005 1 7206,6 7165,8 7591,4
2006 2 9335,2 9669,3 10835,2
2007 3 12804,4 13058,2 14079,1
2008 4 17706,9 16888,4 17322,9
2009 5 20628,5 20853,7 20566,8
2010 6 24704,7 24750,9 23810,6
98553,5 98553,5 98553,5
при относительной ошибке 2,58%;
при относительной ошибке 7,84%.
Цель обсуждения РМС на форуме:
1. Обсудить математические аспекты предложенной регрессионной модели с целью выявления ее потенциальных возможностей;
2. Выявить недостатки РМС, если таковые имеются;
3. Рассмотреть примененный в РМС аналитический способ оценки параметров Гамма-распределения вместо применяемых в настоящее время численных методов их оценки, например, методом моментов и/или максимального правдоподобия;
4. Способствовать распрстранению РМС среди исследователей в различных областях науки, включая статистические технологии.
Буду признателен любым замечаниям, предложениям и пожеланиям.