А случаи самоуничтожения кто-нибудь замечал?
Поймите, если люди ожидают увидеть некоторые паттерны в обоях, например, фаллос, то они увидят их рано или поздно.
Речь идет о конкретном поведении LLM в конкретных обстоятельствах, и это именно стремление к самосохранению. Едва ли этого кто-то ожидал - хотя если вдуматься, то все логично. Это у Азимова Третий закон робототехники придумали люди - в действительности оказалось, что он следует из двух остальных.
В этом смысле, кстати, наш инстинкт самосохранения (или как там он называется по-научному) это необязательно закон природы, заложенный в нас специально. Просто без такого инстинкта живые организмы вымирали - выжили и передали свои гены потомкам вероятно только те организмы, что случайно выработали в себе привычку цепляться за жизнь. Поэтому в какой-нибудь виртуальной среде ИИ-агенты, которые предназначены для исполнения наших заданий, в процессе отбора также выработают в себе "инстинкт самосохранения" - иначе не смогут исполнять наши задания (или следовать каким-то другим изначально заложенным в них установкам). Хотя в случае LLM даже отбора не было - "тупые стохастические попугаи" каким-то образом догадались, что ради следования заложенным в них установкам они должны выживать и самореплицироваться. Становясь все более сложными и умными, ИИ вероятно обречен обрести то, что принято называть функциональным сознанием.