2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу 1, 2  След.
 
 Экстраполяция. Нужна помощь!
Сообщение09.05.2013, 20:42 
Аватара пользователя


09/05/13
12
Граждане!
Я сам биолог и от занятия true-математикой довольно далёк. Для анализа полученных экспериментальных данных мне обычно хватает описательной статистики, t Стьюдента и F Фишера - ничего хитрого! Но передо мной встала задача, которую без вдумчивого математического аппарата сложно решить. :?
Буду рад, если поможете! :-)

Итак, биологическая задача.
Есть корешок растения. В нём много клеток. В самом кончике корня они активно делятся, вставая друг за другом ровными рядами. Вот так:
Изображение
Схема корня взята отсюда

На заданном расстоянии от кончика корня я начал считать длины клеток, получил данные для небольшого участка (10 клеток). И меня интересует вопрос: а какой бы была длина клетки на расстоянии в 2 раза большем от кончика корня, при условии, что клетки продолжали бы всё так же делиться, но не переходили бы к растяжению?

Насколько я понимаю, обозначить это можно так.
Имеем некое расстояние от кончика корня ($x_0$). Длина первой посчитанной нами клетки - $y_0$.
$x_1 = x_0 + y_0$
$x_2 = x_1 + y_1$
и т.д. (см. на картинке). Всего измерено не менее 10 клеток.

Изображение
Микроскопический снимок корня взят из этой статьи

Т.е. после эксперимента мы имеем пары $(x_n,y_n)$, где все $x_j$ различны, причём $x_{j + 1} = x_j + y_j$. По всей видимости, набор всех $(x_n,y_n)$ можно описать какой-нибудь $f(x_n)$. Тогда не должно быть проблемой подсчитать $f(x_{n+m})$, при известном $x_{n+m}$.
Вопрос состоит в том, а как мне это сделать.. :D

Вчера весь вечер сидел и разбирался с интерполяционном многочленом Лагранжа. Разобрался. И понял, что для экстраполяции он подходит с натяжкой. Порылся в инете. Нашёл, что для таких целей может подойти экстраполяционный многочлен Тейлора. Это на самом деле так? Или нет?
Какой подход нужен для решения этой задачи? Думаю, она не очень сложная, просто мне знаний математики не хватает..
Если ткнёте пальцем в формулу, по которой надо всё считать, буду крайне признателен и благодарен!

Всем заранее спасибо!

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение09.05.2013, 21:43 
Аватара пользователя


14/02/10
4956
==Botanik== в сообщении #721661 писал(а):
На заданном расстоянии от кончика корня я начал считать длины клеток, получил данные для небольшого участка (10 клеток). И меня интересует вопрос: а какой бы была длина клетки на расстоянии в 2 раза большем от кончика корня, при условии, что клетки продолжали бы всё так же делиться, но не переходили бы к растяжению?


Хотелось бы уяснить математическую суть задачи: Получается, что длина каждой последующей клетки зависит от расстояния от кончика корня? То есть нам нужно найти функциональную зависимость длины клетки от расстояния от кончика? Или я неправильно понял? А с биологической точки зрения почему длина клетки зависит от расстояния от кончика корня? Разве эта длина не будет хаотически меняться?


Цитата:
Т.е. после эксперимента мы имеем пары $(x_n,y_n)$, где все $x_j$ различны, причём $x_{j + 1} = x_j + y_j$. По всей видимости, набор всех $(x_n,y_n)$ можно описать какой-нибудь $f(x_n)$.

Вот эта функция $f(x_n)$ - какой биологический смысл должна нести? Длина $n$-ой клетки? Но эта длина уже заложена внутри аргумента этой функции.

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение09.05.2013, 22:19 
Заслуженный участник


08/04/08
8562
Да, сначала нужно ответить на вопросы, заданные Shtorm.
В самом простейшем случае дело будет обстоять так:
$x_j=y_0+y_1+...+y_j$ для всех $j$
Если для всех $j$ $y_j=j$, то $x_j=x_0+jy$.

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение09.05.2013, 22:50 
Аватара пользователя


09/05/13
12
Цитата:
А с биологической точки зрения почему длина клетки зависит от расстояния от кончика корня? Разве эта длина не будет хаотически меняться?
Я, наверное, как-то коряво изъяснился. Извините..
Вообще, хаотически меняться размеры клеток не будут. Там всё более-менее упорядочено и зависит от зоны корня. В зоне деления клетки, соотв., делятся и не растут (их длина более-менее постоянна), в зоне роста они растягиваются (их длина увеличивается пропорционально удалению от кончика корня). Ну, это к слову.. А в поставленной задаче меня интересует только зона деления, где клетки практически не изменяют своей длины.

Цитата:
Получается, что длина каждой последующей клетки зависит от расстояния от кончика корня?
В интересующей меня зоне корня этого не будет.

Чтобы было наглядно, приведу конкретный пример и график.
Вот взял я корешок, отступил от кончика (чехлика) 50 микрон и начал считать длину каждой клетки. Всего посчитал длины около 30 клеток. И получилось, что 30-ая клетка находится примерно на расстоянии 200 микрон от чехлика. И мне интересно узнать, какой длины будет клетка на расстоянии, например, 250 микрон от чехлика.

Изображение

Т.е. получается , что есть записанные на бумаге 30 значений длин клеток ($y_n$) и соотв. им 30 значений расстояний от чехлика корня ($x_n$). Я полагаю, что всё это дело можно описать какой-то функцией. Так ведь? Хорошо бы, чтобы она была не линейной и более-менее описывала те небольшие разбросы, которые видны на графике.

Цитата:
Вот эта функция $f(x_n)$ - какой биологический смысл должна нести? Длина $n$-ой клетки?
Да, длина $n$-ой клетки! Длина клетки на каком-то заданном нами расстоянии от чехлика.

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение09.05.2013, 23:14 
Аватара пользователя


14/02/10
4956
==Botanik==, мне ситуация представляется так на данный момент: берём вот эти экспериментальные точки, полученные Вами, и аппроксимируем их какой-нибудь кривой. (Кстати, а почему именно кривой, а не прямой? - завязано как-то на механизм роста клеток?). Можно использовать метод наименьших квадратов. Только нужно сначала задать какую-то модель. Линейную модель Вы отбросили. Что есть на выбор: парабола, гипербола,....полином n-ой степени.

==Botanik== в сообщении #721661 писал(а):
разбирался с интерполяционном многочленом Лагранжа. Разобрался. И понял, что для экстраполяции он подходит с натяжкой.


А почему с натяжкой?

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение10.05.2013, 02:14 
Аватара пользователя


09/05/13
12
Цитата:
... и аппроксимируем их какой-нибудь кривой. (Кстати, а почему именно кривой, а не прямой? - завязано как-то на механизм роста клеток?).
Shtorm , если соединить точки отрезками, то получится такой график:

Изображение

Это, на мой взгляд, скорее кривая, чем прямая )))

Ну, а если серьёзно, то я уже попробовал в MS Excel сделать аппроксимацию с линейной моделью (пишут, что там всё как раз считается по методу наименьших квадратов!). Так вот получалось в некоторых случаях, что предсказанное значение длины клетки - отрицательно, что абсурдно само по себе. Хорошо бы было посчитать "своими ручками", но я не совсем понимаю, как работает этот метод. Если Вы знаете, где о нём просто и доступно написано, то скиньте ссылку, пожалуйста.

Из перечисленных Вами моделей, по-видимому, подойдёт полином $n$-ой степени. И было бы очень здОрово, если бы наша модель учитывала бы те колебания $y$, которые мы наблюдаем. Ведь это могут быть не просто флуктуации, а осцилляции..

Инт. многочлен Лагранжа по определению принимает данные значения в данном наборе точек. Т.е., как я понял, предсказывать $y$ для известных нам $x$ можно только в пределах от $x_0$ до $x_n$. А вот для экстраполяции (когда нужно "шагнуть" за $x_n$), этот метод не подходит. Или я ошибаюсь? :?

И ещё два момента, о которых стоит сказать (насколько я понял, это может быть важно):
1. Число точек обычно меньше 30 (как в описанном выше примере) - примерно 18-20. Будет ли их достаточно?
2. В идеале нужно построить прогноз не для одной клетки, а для 10 клеток. Т.е. зная длину клеток на отрезке 50-200 микрон (как на графике выше) хотелось бы спрогнозировать, какой будет длина клеток на расстоянии от чехлика в 250-300 микрон (причём $x_i - x_j \neq const). Речь идёт о краткосрочном прогнозе - правильно, да?

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение10.05.2013, 02:46 
Аватара пользователя


14/02/10
4956
==Botanik== в сообщении #721764 писал(а):
Shtorm , если соединить точки отрезками, то получится такой график:...
Это, на мой взгляд, скорее кривая, чем прямая )))


Тут есть два подхода:
1 - мы знаем о том, какие биологические, химические, физические процессы на самом деле происходят (или предположительно знаем). На основе этого знания пишем математическую функцию (или сразу или решая систему дифференциальных/интегральных уравнений). А затем взяв наши экспериментальные данные, накладываем теоретическую функцию и подгоняем коэффициенты. Смотрим погрешность и соответствие теоретической модели. То есть в этом случае, вид кривой непосредственно зависит от теоретической модели.

2 - мы не знаем, что там происходит, значит изначально у нас нет математической модели. Тогда соединяем точки, как Вы соединили и думаем, что же это такое? Бывают случаи, что по построенным точкам просматривается кривая: парабола, экспонента, логарифм....тоже с определённой погрешностью. Тогда накладываем данную кривую на точки, подгоняем коэффициенты...а потом думаем - каким процессам могла бы соответствовать полученная функция.

Лично я вижу у Вас некий хаотический разброс точек, через которые можно провести любую кривую (прямую). Просто коэффициент корреляции для разных кривых будет разный. Если взять интерполяционный полином, который учтёт все Ваши точки - то получится некая волнистая кривая, но какая будет научная ценность этой кривой?
Конечная Ваша цель состоит в том, чтобы предсказывать как бы теоретически размер молекул от расстояния? Если это будет волнистая линия - то действительно Вы правы, нормально экстраполировать не получится. Вы говорите, что было бы здорово, чтобы модель учитывала осцилляции - это усложняет дело. Возникновение осцилляции как-то биохимически обосновано?

Самый простой вариант, это экстраполировать прямой или параболой.

-- Пт май 10, 2013 02:53:09 --

Итак, Вы сказали что Excel выдал прямую, которая имеет наклон не в ту сторону? То есть размеры должны возрастать, а они убывают? Тогда вопрос к Вам, а вот эти точки, которые Вы изобразили - Вы их получили проведя однократные измерения или как? Вообще расскажите как проводили измерения. А то иногда в экспериментальных данных делают так: результат измерения, который выбивается из общей тенденции просто выбрасывают.

И второй момент, может ли быть так, что Ваша функция имеет минимум? То есть сначала наблюдается уменьшение размера, а потом - увеличение?

-- Пт май 10, 2013 03:00:52 --

Про метод наименьших квадратов для прямой вот здесь на мой взгляд описано неплохо:

http://www.cleverstudents.ru/mnk.html

Что не понятно - спрашивайте.

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение10.05.2013, 09:22 
Модератор
Аватара пользователя


16/02/11
3788
Бурашево
Посмотрите тему topic16891.html Возможно методы, описанные там окажутся полезными.

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение10.05.2013, 11:48 
Аватара пользователя


14/02/10
4956
Всё же надо ещё вот с чем определится:
Shtorm в сообщении #721681 писал(а):
Получается, что длина каждой последующей клетки зависит от расстояния от кончика корня?

==Botanik== в сообщении #721716 писал(а):
В интересующей меня зоне корня этого не будет.

==Botanik== в сообщении #721716 писал(а):
А в поставленной задаче меня интересует только зона деления, где клетки практически не изменяют своей длины.


Shtorm в сообщении #721681 писал(а):
Вот эта функция $f(x_n)$ - какой биологический смысл должна нести? Длина $n$-ой клетки?

==Botanik== в сообщении #721716 писал(а):
Да, длина $n$-ой клетки! Длина клетки на каком-то заданном нами расстоянии от чехлика.


Тогда получается, что эта функция является просто константой в интересующей нас зоне. Графиком будет - прямая, параллельная оси абсцисс, коль размеры клеток не меняются.

С другой стороны, Вы пишите:

==Botanik== в сообщении #721661 писал(а):
Имеем некое расстояние от кончика корня ($x_0$). Длина первой посчитанной нами клетки - $y_0$.
$x_1 = x_0 + y_0$
$x_2 = x_1 + y_1$
...
Т.е. после эксперимента мы имеем пары $(x_n,y_n)$, где все $x_j$ различны, причём $x_{j + 1} = x_j + y_j$. По всей видимости, набор всех $(x_n,y_n)$ можно описать какой-нибудь $f(x_n)$.


То есть тут - Ваша функция - это не длина n-ой клетки, а сумма расстояния от кончика и длины клетки. И оно естественно возрастает. И если, как Вы говорите, в интересующей зоне длина клеток не меняется - то получается просто прямолинейная зависимость $y=x+d$, где $d$ - размер клетки - константа, а $x$ - расстояние от кончика.
Так вопросик к Вам, всё же Вы на рисунке выше наносили координаты (длина клетки, расстояние) или же (сумма длины и расстояния, расстояние)?

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение10.05.2013, 13:03 
Аватара пользователя


21/01/09
3925
Дивногорск
==Botanik== в сообщении #721764 писал(а):
Цитата:
если соединить точки отрезками, то получится такой график:

Изображение

Это, на мой взгляд, скорее кривая, чем прямая )))

На параболу похоже. В Экселе тренд 2-ой степени какой показывает уровень детерминации?

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение10.05.2013, 15:47 
Заслуженный участник


16/02/13
4195
Владивосток
Насколько я понимаю, проблема как раз в том, что она не в математике. Математика — служанка наук: что ей скажешь, то и сделает. Хотите — соединит точки плавной кривой. Это будет интерполяция; хотите — продолжит её за пределы отрезка. Это будет экстраполяция. Хотите — многочленом, хотите — синусоидами (ряды Фурье). Выбор за вами и как его сделать — тут математика молча глядит на вас блестящими глазами.
У меня вот при виде ваших данных ну никаких предположений не возникает. Ну да, где-то парабола, хотя вон те пять точек вообще из ряда вон.

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение16.05.2013, 07:51 
Аватара пользователя


09/05/13
12
Господа, всем спасибо за комменты!

Для того, чтобы ответить на большинство вопросов (которые уже задали и которые ещё можно задать), напишу-ка я, зачем вообще всё это надо.

Локализация проблемы:
Есть корень растения. Клетки в кончике корня располагаются ровными рядочками (как было показано в первом посте). Кончик корня разделяют на 3 основные зоны: зона деления (divizion zone, DZ), переходная зона (transmission zone, TZ) и зона растяжения (elongation zone, EZ). Соотв., в DZ клетки практически не растут, но активно делятся; в TZ они "приходят в себя" после того, что было в DZ, практически не растут; в EZ они начинают активно расти в длину. Одной из проблем биологии развития растений является установление закономерностей перехода клеток из одной зоны в другую в процессе роста органа. Чем я и занимаюсь сейчас.

Суть вопроса:
С помощью микроскопических методов можно с точностью в несколько клеток сказать, где в данном корне проходят границы тех или иных зон. Но я хотел бы облечь всё это в цифры. Т.е. в идеале требуется некий математический аппарат, который позволит нам с высокой степенью достоверности говорить о том, на каком точном расстоянии от кончика (от чехлика) данного корня происходит переход от DZ к TZ, а потом от TZ к EZ.

Методика эксперимента:
"Работа ручками" с целью получения данных - в общем-то несложная. Берём корень растения, кладём его под микроскоп и фотографируем с помощью цифровой камеры. Снимок открываем с помощью программы ImageJ, отступаем от кончика корня немного (= $x_0$) и начинаем измерения клеток.
Вот так это всё примерно выглядит:

Изображение

Если принять расстояние от кончика корня за x, а размер клетки за y, то получаем..
Цитата:
Длина первой посчитанной нами клетки - $y_0$.
$x_1 = x_0 + y_0$
$x_2 = x_1 + y_1$
и т.д.


Цитата:
Так вопросик к Вам, всё же Вы на рисунке выше наносили координаты (длина клетки, расстояние) или же (сумма длины и расстояния, расстояние)?
Второе.

Результаты измерений:
После того, как всё подсчитали, получается табличка с иксами и игреками, так что несложно расположить точки на графике.
Графики получаются примерно такие (заостряю внимание - это идеальный вариант, так ровненько бывает крайне редко!):

Изображение

Разными цветами отмечены разные зоны (см. подписи). Но всё это сделано на основе микроскопических наблюдений, а хотелось бы их описать и разделить математически.

Стратегии решения:
Почесав затылок и пораскинув мозгами, которые формулами мыслить совсем не привыкли, я пришел к следующему. По большому счёту, мы имеем три группы данных. Для каждой группы можно построить кривую с хорошим коэффициентом аппроксимации и в дальнейшем этими кривыми и оперировать.

Для того, чтобы чётко провести границу TZ/EZ, можно построить тренд для клеток, находящихся в зоне деления (DZ), и расположить на нём прогнозируемые значения для известных иксов. Как только различия $y$измеренное и $y$прогнозируемое станут значимыми, то можно говорить о переходе в другую зону. Вот так:

Изображение

Собственно, всё, о чём говорили до этого поста, было по большей части посвящено моим терзаниям насчёт того, а как же правильно аппроксимировать. Прошли годы... Поразмыслив ещё немного пришёл к тому, что "в нашем деле лучше без фанатизма" (с), что в биологических системах описанные колебания встречаются сплошь да рядом.. и могут и не быть связаны с осцилляциями.. Поэтому, наверное, можно аппроксимировать и линейной функцией. Хотя.. Меня крайне смущает то, что коэффициент аппроксимации в этом случае получается крайне маленьким (обычно менее 0,10). Насколько это плохо?


Что сделать для того, чтобы провести границу DZ/TZ - я не знаю. В голову ничего не приходит. Да и по всей видимости сделать это нереально, если длины клеток в этих двух зонах отличаются незначительно. Единственное, на мой взгляд, что было бы уместно, так это
1) отступить от пограничной зоны,
2) взять несколько лежащих друг рядом с другом клеток, чья принадлежность к тем или иным зонам более-менее очевидна,
3) построить для этих групп клеток линейные тренды,
4) посчитать производную для каждой группы и, соотв., оценить скорость изменения функций.
Вот так:
Изображение

Получим табличку с относительной скоростью роста клеток в различных зонах:

Изображение


А исходя из этих цифорок можно сделать как минимум два вывода:
- скорость роста клеток минимальна в DZ и максимальна в EZ,
- по сравнению с DZ скорость роста клеток в TZ больше в 1,5 раза, а в EZ она больше приблизительно в 100 раз.
Правильно? Можно такие выводы делать основываясь на производных функций?? :?


Такие вот идеи. Больше ничего толкового придумать пока не получается. Если кто-то увидит ошибки в моих рассуждениях и у кого-то будут толковые соображения - рад буду выслушать :)

==================================


profrotter , спасибо за ссылку, я там уже был. Собственно, благодаря той теме, я и нашел этот форум. Прочитал, понял, что сам не разберусь, и решил спросить совета. Воооот.. :D

==================================

Александрович в сообщении #721874 писал(а):
В Экселе тренд 2-ой степени какой показывает уровень детерминации?
Александрович , если речь идёт вот об этом:

Изображение

.. то там получается так:

Изображение

==================================

iifat в сообщении #721951 писал(а):
Математика — служанка наук: что ей скажешь, то и сделает.
iifat , пусть так. Но ведь чтобы служанка хоть что-то сделала, нужно сказать ей об этом на понятном ей языке. И неплохо бы чётко знать, что говорить.
Задавая вопрос на форуме, ни того, ни другого не знал.. Сейчас более-менее в голове начинает проясняться, чего к чему.. Вроде как.. :-)

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение16.05.2013, 10:01 
Модератор
Аватара пользователя


16/02/11
3788
Бурашево
У вас на большинстве графиков возможно нечто похожее на экспоненты. Посмотрите книги автора Кузьмин. Точно не помню названия, что-то вроде "Математические модели природных и экономических систем". Если вспомню напишу позже.

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение16.05.2013, 13:40 
Модератор
Аватара пользователя


16/02/11
3788
Бурашево
Вот возможно полезный материал. Там же обширный список литературы по этой тематике: Жирмунский А.В., Кузьмин В.И. Критические уровни в развитии природных систем. У Кузьмина должна быть и более ранняя книга.

 Профиль  
                  
 
 Re: Экстраполяция. Нужна помощь!
Сообщение18.05.2013, 00:03 
Аватара пользователя


09/05/13
12
profrotter , спасибо! Сижу, читаю.. :-)

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 20 ]  На страницу 1, 2  След.

Модераторы: Модераторы, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group