2014 dxdy logo

Научный форум dxdy

Математика, Физика, Computer Science, Machine Learning, LaTeX, Механика и Техника, Химия,
Биология и Медицина, Экономика и Финансовая Математика, Гуманитарные науки




Начать новую тему Ответить на тему На страницу 1, 2, 3, 4  След.
 
 Критерии для отбора признаков классификации
Сообщение13.09.2022, 08:22 


15/03/17
5
Здравствуйте.

Хотел бы задать вопрос, на который пока не нашел ответ. Меня интересуют принципы классификации растений и животных. А именно – по какому критерию ученые-систематики отбирают тот или иной признак для классификации. К примеру, почему существует отряд позвоночные, а не существует отряд «когтистые» или «зеленоглазые»?

Я человек далекий от биологии, поэтому, если такое возможно, объясните, пожалуйста, популярным языком. Если есть какая-то популярная литература, лекции и т.п. по данной тематике, то буду очень благодарен за ссылки.

Повторюсь, что меня интересуют не сами признаки классификации, а то, по каким критериям их, эти признаки, отбирают.
(Читал, что сейчас, вроде-бы, пытаются организовать классификацию по ДНК. Но так и не понял, это уже общепризнанный метод или нет.)

Спасибо.

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение13.09.2022, 17:16 
Аватара пользователя


11/06/12
10390
стихия.вздох.мюсли

(Оффтоп)

panda-walker в сообщении #1564629 писал(а):
отряд позвоночные
panda-walker в сообщении #1564629 писал(а):
Я человек далекий от биологии
Оно и видно. Позвоночные не отряд. Отряд это, к примеру, грызуны, хищные, приматы.

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение13.09.2022, 18:41 


15/03/17
5

(Оффтоп)

Aritaborian в сообщении #1564639 писал(а):
[off]
panda-walker в сообщении #1564629 писал(а):
отряд позвоночные
panda-walker в сообщении #1564629 писал(а):
Я человек далекий от биологии
Оно и видно. Позвоночные не отряд. Отряд это, к примеру, грызуны, хищные, приматы.

Да ладно вам. Лучше, ответьте на вопрос.[/off]

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение14.09.2022, 02:14 
Аватара пользователя


22/07/22

897
panda-walker
Тут не в признаках дело, а в выделении клад. Сначала находим все виды, которые ближе друг к другу, чем к другим видам, объявляем это родом, проделываем то же самое с родами, объединяя их в семейства и т.д. (разумеется, тут могут возникнуть и дробные клады, подотряд, надотряд и т.д., т.к. эти клады больше не количественные, а качественные). Короче, клада это совокупность всех видов, которые ближе друг к другу, чем к другим видам, и клада может содержать другие клады. А вот названия клад могут даваться по признаку, который общий (или почти общий) для всех видов этой клады, т.е. поиск признака не первичен, а вторичен.
Есть еще другой подход, генетический. Это когда мы по ДНК видов строим филогенетические деревья, с указанием длины всех веточек и ветвлений. Он является более универсальным, чем традиционный систематический, т.к. точнее и однозначнее (потому что клады в некоторых случаях можно выделять неоднозначно, т.к. это качественные понятия)

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение14.09.2022, 14:09 


10/03/16
4444
Aeroport
Doctor Boom в сообщении #1564652 писал(а):
Сначала находим все виды, которые ближе друг к другу


Что такое БЛИЖЕ??? panda-walker задает именно этот вопрос. Если у нас есть мера близости, то организовать алгоритм иерархической кластеризации не проблема (первый уровень можно обозвать "род", второй -- "вид", третий --
Doctor Boom в сообщении #1564652 писал(а):
клад
, четвертый -- "Капитан Джек Воробей" и т.д.). Вся мякотка зарыта именно в критерии близости. Разумный человек скажет -- близость цепочек ДНК в смысле расстояния Хэмминга, Левенштейна и т.п., но тут была тема про философию, где имеющий образование биофака kry утверждал, что часто генетически близкие объекты попадают в разные классы (роды, виды, клады - я в этом не разбираюсь). Пытался найти это сообщение -- пока безуспешно.

Вот есть объект А. У объекта В есть когти, как и у А, но другие глаза, а у С схожий цвет глаз, но нет когтей. Кто из них ближе к А?

Doctor Boom в сообщении #1564652 писал(а):
Есть еще другой подход, генетический. Это когда мы по ДНК видов строим филогенетические деревья, с указанием длины всех веточек и ветвлений. Он является более универсальным, чем традиционный систематический, т.к. точнее и однозначнее


Согласен, что к иерархической кластеризации на основе ДНК (биоинформатика) претензий быть не может, т.к. все методы там из Data Science. НО - см. выше, что говорил kry. C появлением кластеризации по ДНК выяснилось, что некоторые (виды, роды, .......) кластеризуются не так, как это было традиционно. Однако, традиционная кластеризация не была признана лженаукой и сохранилась. Почему?

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение14.09.2022, 14:24 
Заслуженный участник


18/09/21
1765
Биологический вид: Признаки
Цитата:
Один вид можно отделить от другого по пяти основным признакам.
  • Морфологический критерий позволяет различать разные виды по внешним и внутренним признакам.
  • Физиолого-биохимический критерий фиксирует неодинаковость химических свойств и физиологических процессов разных видов.
  • Географический критерий свидетельствует, что каждый вид обладает своим ареалом.
  • Экологический позволяет различать виды по комплексу абиотических и биологических условий, в которых они сформировались, приспособились к жизни.
  • Репродуктивный критерий обуславливает репродуктивную изоляцию вида от других, даже близкородственных.

Карл Линней (1707—1778), когда заложил основы классификации, понятия не имел про ДНК.
Цитата:
Линней использовал в классификации четыре уровня (ранга): классы, отряды, роды и виды.

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение14.09.2022, 14:55 


10/03/16
4444
Aeroport
zykov в сообщении #1564665 писал(а):
Один вид можно отделить от другого по пяти основным признакам.


Тут сразу несколько вопросов.

zykov в сообщении #1564665 писал(а):
Репродуктивный критерий обуславливает репродуктивную изоляцию вида от других, даже близкородственных.


Тут вроде все понятно: представители одного вида скрещиваются, представители разных -- нет. Этого достаточно, чтобы кластеризовать особей по видам -- зачем еще четыре признака? Если они хотят сказать, что последний признак со 100%-й вероятностью влечет первые четыре, то это заведомо не так -- у африканцев и русских разные ареалы обитания, но мы можем скрещиваться, т.е. относимся к одному виду.

Но ведь видами дело не ограничивается, так ведь? И тогда вступают в дело остальные критерии:

zykov в сообщении #1564665 писал(а):
Экологический позволяет различать виды по комплексу абиотических и биологических условий, в которых они сформировались, приспособились к жизни.


Этот комплекс задается сколькими переменными? Какой алгоритм кластеризации используется? Доказано ли, что он дает разумные результаты в пространстве такой большой размерности и с таким малым числом обучающих прецедентов?

zykov в сообщении #1564665 писал(а):
Морфологический критерий позволяет различать разные виды по внешним и внутренним признакам.


Тут с размерностью как-то получше, потому что морфологических признаков не так много. Но встает вопрос -- что важнее, цвет глаз или наличие когтей?

P.S. Вроде Фазиль Эскандер разделил все книжки на литературу дома (Л.Толстой) и литературу бездомья (Лермонтов). Но это как бы и не наука, а личные субъективные соображения (с которыми лично я согласен на 100%). Меж тем биология с ее родами, видами, отрядами, ротами и подразделениями позиционирует себя как науку. Поэтому есть повод подушнить.

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение14.09.2022, 16:21 
Аватара пользователя


22/07/22

897
ozheredov в сообщении #1564663 писал(а):
Что такое БЛИЖЕ??? panda-walker задает именно этот вопрос. Если у нас есть мера близости, то организовать алгоритм иерархической кластеризации не проблема (первый уровень можно обозвать "род", второй -- "вид", третий --

Нет, у нас в случае традиционной классификации нет меры близости :-) Ближе это значит ближе, сами данные должны иметь кластеризационную структуру.
ozheredov в сообщении #1564663 писал(а):
тут была тема про философию, где имеющий образование биофака kry утверждал, что часто генетически близкие объекты попадают в разные классы (роды, виды, клады - я в этом не разбираюсь). Пытался найти это сообщение -- пока безуспе шно.

Это не страшно, если топология дерева сохраняется (если нет, то значит неправильно систематизировали, такое было например с черепахами и др., но это редко бывает). А то что у разных родов, классов разные генетические диапазоны (если сравнивать клады одинакового уровня) ничего удивительного нет, т.к. это больше качественные понятия, как оценки в школе. В одной школе трем ученикам могут поставить 3,4,5, и в другой так же, хотя степень разброса знаний у них может быть разные, т.к. в одной школе уровень учеников скачет, а в другой он более ровный, хотя уровни знаний в виде оценок более менее можно выделять в обоих коллективах
ozheredov в сообщении #1564663 писал(а):
Вот есть объект А. У объекта В есть когти, как и у А, но другие глаза, а у С схожий цвет глаз, но нет когтей. Кто из них ближе к А?

Слишком мало признаков, их как минимум десятки (если брать только кости, как у динозавров например)
ozheredov в сообщении #1564663 писал(а):
Однако, традиционная кластеризация не была признана лженаукой и сохранилась. Почему?

Потому что удобна и сохраняет топологию, хотя некоторые таксоны, ставшие парафилетическими, могут сохранять такой статус кво (потому что часть видов из них ну очень сильно изменилась, например птицы, китообразные, наземные позвоночные)
ozheredov в сообщении #1564666 писал(а):
Этого достаточно, чтобы кластеризовать особей по видам -- зачем еще четыре признака

Не достаточно, понятие вида нечеткое, представители разных видов иногда могут скрещиваться, и давать плодовитое потомство. И вообще способность скрещиваться не дискретная (есть либо нет), а описывается больше действительным числом от 0 до 1.
ozheredov в сообщении #1564666 писал(а):
Тут с размерностью как-то получше, потому что морфологических признаков не так много. Но встает вопрос -- что важнее, цвет глаз или наличие когтей?

Морфологических признаков дофига, вы просто про них ничего не знаете :mrgreen: Для выделения одних лишь рас их много (они не видны невооруженным взглядом, их можно померить)

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение14.09.2022, 20:54 
Заслуженный участник
Аватара пользователя


01/09/13
4676
ozheredov в сообщении #1564663 писал(а):
претензий быть не может, т.к. все методы там из Data Science

Уже смешно :mrgreen:

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение14.09.2022, 21:49 
Заслуженный участник
Аватара пользователя


16/07/14
9203
Цюрих
ozheredov в сообщении #1564666 писал(а):
Тут вроде все понятно: представители одного вида скрещиваются, представители разных -- нет.
Проблема в том, что отношение "скрещиваться друг с другом" не является отношением эквивалентности.

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение15.09.2022, 13:16 


10/03/16
4444
Aeroport
Doctor Boom в сообщении #1564669 писал(а):
Нет, у нас в случае традиционной классификации нет меры близости :-) Ближе это значит ближе


Определить близость двух объектов возможно ровно в двух случаях:

1. Если между ними задана метрика
2. Если они расписались в ЗАГСе, скрепив свой союз страстным поцелуем.

И что-то я слабо представляю себе зверушек, идущих в ЗАГС.

Doctor Boom в сообщении #1564669 писал(а):
сами данные должны иметь кластеризационную структуру


Нельзя ли пояснить эту фразу? Каким образом распознать "кластеризационную структуру" данных при отсутствующей метрике?

Doctor Boom в сообщении #1564669 писал(а):
Это не страшно, если топология дерева сохраняется (если нет, то значит неправильно систематизировали, такое было например с черепахами и др., но это редко бывает).


Вы хотите сказать, что давным-давно биологи настолько удачно провели ИЕРАРХИЧЕСКУЮ кластеризацию всего и вся, что появившаяся кластеризация на основе ДНК практически никак не изменила топологию конечного дерева, за исключением мелких деталей, касающихся каких-то черепах? Ок, сделаем вид, что я не подвергаю сомнению ванго-способности биологов. Но как же все-таки им удалось так ловко всех раскластеризовать, как выстраивались приоритеты между признаками? Напомню, что вопрос ТСа был как раз об этом.

Doctor Boom в сообщении #1564669 писал(а):
В одной школе трем ученикам могут поставить 3,4,5, и в другой так же, хотя степень разброса знаний у них может быть разные


Классификация учеников по оценкам, выставленным в конкретной школе, не является наукой. Я могу иметь 3 с минусом в 57-й школе, перевестись в районку и иметь там 5 с четырьмя плюсами. Неудачный пример.

Doctor Boom в сообщении #1564669 писал(а):
Слишком мало признаков, их как минимум десятки (если брать только кости, как у динозавров например)


В таких задачах обычно чем меньше размерность, тем устойчивее решение. В этой задаче не так? ДокажИте. Затем объясните, please, каким образом работать с этими десятками признаков.



mihaild в сообщении #1564685 писал(а):
Проблема в том, что отношение "скрещиваться друг с другом" не является отношением эквивалентности.


Отсутствует рефлексивность? :lol1: (ну, Вы понели)

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение15.09.2022, 13:39 
Заслуженный участник
Аватара пользователя


16/07/14
9203
Цюрих
ozheredov в сообщении #1564705 писал(а):
Отсутствует рефлексивность?
Отсутствует транзитивность.
Отношение, естественно, надо рассматривать на популяциях, и для них рефлексивность присутствует.
(и это даже если брать нормальные организмы типа позвоночных; если брать грибы, то там без поллитры где популяция а где организм - не разберешься)

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение15.09.2022, 20:03 
Аватара пользователя


22/07/22

897
ozheredov в сообщении #1564705 писал(а):
Определить близость двух объектов возможно ровно в двух случаях:

1. Если между ними задана метрика
2. Если они расписались в ЗАГСе, скрепив свой союз страстным поцелуем.

Не всегда, иногда сами данные имеет естественную кластеризационную структуру, так что выделение кластеров (или биологических клад) однозначно на очень большом классе всевозможных разумных метрик. Вообще не все так просто, как вам бы хотелось, чтобы была какая-то универсальная метрика, а кластеризацию провели успешно, что дополнительно подтвердилось ДНК-филогинией :-)
ozheredov в сообщении #1564705 писал(а):
Нельзя ли пояснить эту фразу? Каким образом распознать "кластеризационную структуру" данных при отсутствующей метрике?

Анализом, вот как выделили гоминид, германскую группу языков, млекопитающих? :D
ozheredov в сообщении #1564705 писал(а):
Вы хотите сказать, что давным-давно биологи настолько удачно провели ИЕРАРХИЧЕСКУЮ кластеризацию всего и вся, что появившаяся кластеризация на основе ДНК практически никак не изменила топологию конечного дерева, за исключением мелких деталей, касающихся каких-то черепах?

Да, и это вы можете прочесть в любом учебнике по биологии :-) Это одно из доказательств ТЭ, что систематизация по ДНК почти полностью повторила традиционную.
ozheredov в сообщении #1564705 писал(а):
Ок, сделаем вид, что я не подвергаю сомнению ванго-способности биологов.

Тут не нужны ванго-способности, эволюционная классификация это целая наука, со своими методами, анализом и т.д. То, что вы с таким снобизбом относитесь к другой науке, говорит лишь о вашем невежестве :-)
ozheredov в сообщении #1564705 писал(а):
Но как же все-таки им удалось так ловко всех раскластеризовать, как выстраивались приоритеты между признаками?

Нет никаких приоритетов признаков, есть множество совокупностей кучи признаков, по которым можно построить древесную классификацию. Признаки, которые как бы характеризуют всю кладу (как кормление молоком например) уже выбираются постфактум (хотя теоретически не все представители этой клады могут его иметь, например панда относится к хищным, но не плотояден)
Если формализировать задачу, и рассмотреть небольшое число признаков, то есть методы, которые позволяют построить дерево этих объектов (если в таковое они выстраиваются), и чем больше признаков, тем надежнее дерево. В пределе очень большого числа признаков все сведется по сути к построению дерева по ДНК из миллионов нуклеотидов, тут все проще.
ozheredov в сообщении #1564705 писал(а):
Напомню, что вопрос ТСа был как раз об этом.

ТСу уже ответили
ozheredov в сообщении #1564705 писал(а):
Классификация учеников по оценкам, выставленным в конкретной школе, не является наукой. Я могу иметь 3 с минусом в 57-й школе, перевестись в районку и иметь там 5 с четырьмя плюсами. Неудачный пример.

Значит, вас перевили в слабый класс слабой школы, что логично. Ваш статус отличника зависит от окружения, так же как особенности выделения семейств, родов диктуются особенностями отношения между видами, которые в них входят. Это была как раз демонстрация того, почему разные семейства могут иметь разные генетические диапазоны.
ozheredov в сообщении #1564705 писал(а):
В таких задачах обычно чем меньше размерность, тем устойчивее решение

В каких "таких"? Как раз наоборот, чем больше признаков, тем устойчивее дерево. Поэтому классификация по ДНК самая подробная и устойчивая, там миллионы нуклеотидов.

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение16.09.2022, 06:02 


15/03/17
5
Благодарю всех участников темы за ответы.

Doctor Boom писал(а):
Не всегда, иногда сами данные имеет естественную кластеризационную структуру, так что выделение кластеров (или биологических клад) однозначно на очень большом классе всевозможных разумных метрик.

Правильно ли я понял, что в биологии сначала рассматривают на основе каких метрик может получиться "хороший" (достаточно четко изолированный) клад и только потом говорят, что применяем именно этот набор "разумных метрик" для классификации?

И еще пара вопросов.
Doctor Boom писал(а):
эволюционная классификация это целая наука, со своими методами, анализом и т.д.

Насколько я знаю, первая (или одна из первых) фундаментальная таксономия была проведена К.Линнеем в 18 веке. После этого были ли, по мере развития науки эволюционной классификации, принципиальные пересмотры признаков классификации? Или изначально было все настолько удачно, что этого не понадобилось?

Вопрос, не совсем по теме, но интересно:
Doctor Boom писал(а):
И вообще способность скрещиваться не дискретная (есть либо нет), а описывается больше действительным числом от 0 до 1.

Означает ли это, что не все популяционное множество может скрещиваться с другим видом, а лишь какая-то его часть (случайным образом?)?

 Профиль  
                  
 
 Re: Критерии для отбора признаков классификации
Сообщение18.09.2022, 22:12 


10/03/16
4444
Aeroport
Doctor Boom в сообщении #1564731 писал(а):
Не всегда, иногда сами данные имеет естественную кластеризационную структуру, так что выделение кластеров (или биологических клад) однозначно на очень большом классе всевозможных разумных метрик.


Разумная мысль, только вот я сильно сомневаюсь, что отцы-основатели биологической классификации умели юзать кластеризацию и вообще знали, что такое метрика. Более того, меня смущает выделенное слово "иногда". То есть, были случаи, когда когда однозначная топология дерева на множестве метрик не вырисовывалась, но (воображаемых рациональных) биологов это не остановило? (Реальных биологов, я думаю, не останавливает ничего и никогда).

Doctor Boom в сообщении #1564731 писал(а):
Анализом, вот как выделили гоминид, германскую группу языков, млекопитающих? :D


Вот и расскажите, как выделили германскую группу млекопитающих. Какой такой был проведен анализ и при помощи каких отличающихся от левой ноги инструментов.

Doctor Boom в сообщении #1564731 писал(а):
Это одно из доказательств ТЭ, что систематизация по ДНК почти полностью повторила традиционную.


То есть я правильно понял, что результат кластеризации неких объектов левой ногой по одному алгоритму (допустим) совпал с результатом по другому алгоритму, и это доказало верность представлений о процессе появления этих объектов? А какое отношение имеет одно к другому? Если я могу отличать группу мужчин от группы женщин ка по голосам, так и по внешке, то это означает, что все они родом из Караганды, а прилетели сюда на самолете?

Doctor Boom в сообщении #1564731 писал(а):
Нет никаких приоритетов признаков

То есть берется миллиард признаков, включая число волосков на шкуре, вынимательно анализируется и -- бабах! -- возникает классификация, которая к тому-же совпадает с той, которую дают методы биоинформатики, на 95-99% состоящие из DS. Для меня это выглядит, мягко говоря, фантастически и требует дополнительных пояснений. На простых примерах. Вот есть панда, у нее такие и такие признаки, и есть бурый медведь, .... и т.д.

Doctor Boom в сообщении #1564731 писал(а):
Признаки, которые как бы характеризуют всю кладу (как кормление молоком например) уже выбираются постфактум


Выше Вы говорите, что приоритетов нет. А теперь выясняется, что есть признаки, которые выбираются ПОСТФАКТУМ, а значит, не входят в исходный набор признаков. И ПОСТ- какой -ФАКТУМ они выбираются (в какой момент времени)? Когда классификация уже подчищена с учетом совпала с результатом анализа ДНК?

Doctor Boom в сообщении #1564731 писал(а):
чем больше признаков, тем надежнее дерево


Да-а????? А может,
Doctor Boom в сообщении #1564731 писал(а):
прочесть в любом учебнике

,только не биологии, как оно на самом деле? Включите в признаки число волосков на шкуре и т.д. -- посмотрим, получится ли устойчиво отличать кошку от собаки.

Doctor Boom в сообщении #1564731 писал(а):
Значит, вас перевили в слабый класс слабой школы, что логично. Ваш статус отличника зависит от окружения, так же как особенности выделения семейств, родов диктуются особенностями отношения между видами, которые в них входят.


То есть у нас новый признак -- особенности отношений между видами -- поприветствуем апплодисментами! Заодно попробуем его формализовать, так чтобы можно было строить деревья. Ну и сверимся с любым учебником биологии на предмет, как этот признак формализуется там.

Doctor Boom в сообщении #1564731 писал(а):
например панда относится к хищным, но не плотояден


Например, я испанский летчик, но не испанец и не летаю. Хороший пример -- показательный.

-- 18.09.2022, 22:19 --

panda-walker в сообщении #1564767 писал(а):
Правильно ли я понял, что в биологии сначала рассматривают на основе каких метрик может получиться "хороший" (достаточно четко изолированный) клад и только потом говорят, что применяем именно этот набор "разумных метрик" для классификации?


Заметим, что "хороший" (достаточно четко изолированный) также нуждается в формализации. К вопросу присоединяюсь.

panda-walker в сообщении #1564767 писал(а):
Насколько я знаю, первая (или одна из первых) фундаментальная таксономия была проведена К.Линнеем в 18 веке. После этого были ли, по мере развития науки эволюционной классификации, принципиальные пересмотры признаков классификации? Или изначально было все настолько удачно, что этого не понадобилось?


Присоединяюсь к вопросу и вангую ответ: "Естеееественно, там все изначально было правильно!" Вспомнил анекдот про то, что математикам нужны карандаши и ластики, чтобы исправлять ошибки. А философы -- они не такие тупые, им ластики не нужны -- у них сразу все безупречно.

 Профиль  
                  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 47 ]  На страницу 1, 2, 3, 4  След.

Модераторы: photon, Deggial, korona, Ende, Супермодераторы



Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group