2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




 
 Вопрос по NumPy (Python), проверка гипотезы о линейности
Сообщение17.08.2016, 15:10 
Аватара пользователя
Есть большая матрица чисел, нужно проверить, насколько задаваемая ею зависимость $(i, j) \mapsto m_{i, j}$ близка к линейной. Более точно, эта матрица взята из реальных физических данных, у меня есть подозрение, что этот физический процесс задаёт линейную зависимость от двух аргументов, матрица точно линейную зависимость не даст из-за погрешностей измерения, нужно проверить, насколько гипотеза о линейности правдоподобна.

Нет ли в NumPy или других Python-библиотеках средства, которое позволит это сделать быстро? Пока я предполагаю средствами Python построить линейную регрессию двух аргументов $m_{i, j} \to L(i, j) = A \cdot i + B \cdot j + C$, затем посчитать среднеквадратичное отклонение $\sum{(m_{i, j} - L(i, j))^2}$, по величине которого и принять решение. Это, думаю, осмысленный способ, но я не очень хорошо знаю питон, и потому это буду писать руками (даже регрессию, хотя наверняка для неё тоже есть уже готовые библиотеки). Если кто знает готовое решение для этой задачи (или хотя бы для регрессии, средний квадрат я уж сам тогда посчитаю) — подскажите, пожалуйста.

 
 
 
 Re: Вопрос по NumPy (Python), проверка гипотезы о линейности
Сообщение17.08.2016, 17:28 
Для начала можно посчитать коэффициент определенности $R^2$:

http://docs.scipy.org/doc/scipy-0.15.1/ ... gress.html

Но лучше почитать нормальную литературу о линейной регрессии и провести полноценную диагностику, как в этих примерах:

http://statsmodels.sourceforge.net/deve ... stics.html
https://degninou.net/2016/02/04/multipl ... th-python/

 
 
 [ Сообщений: 2 ] 


Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group