Wednesday, 25 March 2020

Что такое вероятностные ресурсы (часть 2)

 Expertise does not necessarily drive you in the right direction of common sense.
Douglas Axe

Продолжение. Начало здесь. Для удобства снова приведу иллюстрацию.

Рис.1: Сравнение гомологичности белков, ответственных за миграцию нейронов, у человека и др. организмов. Гомологичность белкам человека низка у беспозвоночных, однако резко возрастает, начиная с хрящевых рыб и сохраняется высокой для всех позвоночных. По степени гомологичности делается вывод о появлении у хрящевых рыб новой функции. Информационный скачок, сопровождающий это событие, многократно превышает пороговое значение 140 функциональных бит, достижимых эволюционным путём. Следовательно, данная новая функция представляет собой дизайн.
И ещё одно замечание о связи между числом состояний 2140, доступных эволюции, и количеством функциональной информации на иллюстрации ниже. Представьте себе, что одну и ту же мысль можно донести различными предложениями. Так вот число предложений с одинаковым смыслом обозначим через K. В нашем случае роль предложений будут выполять полипептиды (первичные структуры белков), а под смыслом мы будем понимать заданный уровень биохимической функции (способность белка вступать в определенное белковое взаимодействие, скажем, связывать АТФ). Легко себе представить, что при возрастании числа изменений в порядке букв в наших предложениях выявить первоначальный смысл будет всё тяжелее и наконец он станет совсем неуловим. Или, напротив, путем манипуляций с буквами в некоторых случаях можно восстановить первоначальный смысл предложения даже если информация частично утрачена, как это сделали герои романа Жюля Верна "Дети капитана Гранта". То же самое происходит и с биологической функцией: при перестановках пептидов в полипептидной цепи уровень белковой функции меняется. Предположим, что существует всего одна строка (K=1) во всём пространстве из |П| = 2140 полипептидов, которая доставляет некоторую функцию f. Тогда, по введенному определению, количество функ. информации в этой строке составит -log2(K/|П|) = -log2(1/2140) = 140 функ. бит. Это максимум, что может эволюция. Если у этой строки существуют синонимы (то есть в случае K > 1), количество функ. информации в каждом из синонимов, соответственно, будет меньше. В blast-анализе используется мера bitscore (количество совпадающих бит в двух сравниваемых строках). Чем больше bitscore, тем больше совпадений между строками, тем больше вероятность того, что мы имеем некоторую важную функцию, данный совпадающий кусок сравниваемых строк ее кодирует, а отбор относительно нее действует очищающим образом (что видно на рисунке ниже -- рассматриваемая функция появляется у рыб и присутствует у всех позвоночных, включая человека). Итак, информационный порог эволюции: log2|П| = 140 бит (это не шенноновские биты, а функциональные). Отсюда интересный практический тест на дизайн той или иной биологической функции (который делал gpuccio в своих статьях). Если скачок функциональной информации (оцениваемый blast-анализом как bitscore) превышает 140 бит, то данная функция -- явный дизайн. И, наконец, важно помнить, что пороговое значение в 140 функциональных бит как тест на дизайн -- это очень завышеная, то есть гарантированная оценка. На практике возможности эволюции по оптимизации функции гораздо скромнее. Мы даём большую фору нашим оппонентам. В blast-анализе используется мера bitscore (количество совпадающих бит в двух сравниваемых строках). Чем больше bitscore, тем больше совпадений между строками, тем больше вероятность того, что мы имеем некоторую важную функцию, данный совпадающий кусок сравниваемых строк ее кодирует, а отбор относительно нее действует очищающим образом (что видно на рисунке выше -- рассматриваемая функция появляется у рыб и присутствует у всех позвоночных, включая человека). 

Интересно, что в статье Abel, Durston, Chiu "Measuring the functional sequence complexity of proteins" ставится та же задача, но подход там несколько иной. Они вычисляют функц. информацию, которая соответствует всей молекуле белка, суммируя информационные дельты по каждой позиции его первичной структуры (полипептидной цепи). Максимальное значение удельной дельты на аминокислоту = log220, так как мощность аминокислотного алфавита = 20. Единица измерения функ. информации, предложенная авторами статьи, - это functional bit (fit). 

Важная фраза из статьи: "The Fit values obtained can be discussed as the measure of the change in functional uncertainty required to specify any functional sequence that falls into the given family being analyzed". Мой перевод: "Количество функциональных бит соответствует уменьшению функциональной неопределенности, необходимому для того, чтобы задать/указать ту или иную функциональную строку, принадлежащую к определенному семейству белков." 

Т.обр., функция есть нечто, позволяющее указать определенную альтернативу из множества возможных. Вот это самое указание (спецификация) и есть то, что достигается только интеллектуально и никак иначе. Природа этого делать не умеет, она не принимает решений, не выбирает по нефизическим критериям (metabolic или др. utility) и поэтому ей всё равно, работает клетка или нет. Сложная функция не появляется постепенным развитием простой, но только дискретно, скачками (как на рисунке), причем скачки эти (если они достаточно большие по величине), как мы видели, может реализовать только интеллект. 

Возьмем к примеру велосипед и вертолет, между которыми нет никакого дарвиновского пути. Велосипед велосипедом, а вертолет -- это принципиально новое по сравнению с велосипедом. В вертолете могут лишь использоваться некоторые общие принципы велосипеда (вращение колеса, передача), однако "автомагически" велосипед ни при каких условиях не превратится в вертолет, поскольку вероятностные ресурсы возможных преобразований велосипедов в вертолеты ограничены. Ландшафт, по которому нам придётся двигаться в параметрическом пространстве, совершенно исключает дарвиновское движение, ведь оно, как известно, имеет свойство стагнировать в локальных пиках (даже с учетом того, что сам ландшафт изменяется со временем): слишком велики вероятностные барьеры, стоящие у него на пути. Предположим, что для преобразования велосипеда в вертолет нам потребуется 100 мутаций (это серьезное упрощение, поскольку оно не учитывает того, сколько новых функций, которых нет у велосипеда, нам придется добавить). Предположим также, что эти 100 мутаций независимы и пусть для простоты каждая из них имеет вероятность закрепления по популяции, равную р (СТЭ: мутации возникают случайно, закрепление мутации -- это событие распространения мутированного гена на всю популяцию вследствие отбора). Вероятность закрепления всех 100 мутаций последовательно составит p100. Это смехотворно малая величина. Для преодоления такого вероятностного барьера вероятностные ресурсы биоты категорически недостаточны. В реальности для перестройки из велосипеда в вертолет нужен разум (предвидение, стратегическое планирование, принятие решений по достижению целевого состояния). Предлагать биологическую эволюцию как средство достижения такой цели просто смешно. 

Интеллект не есть что-то эфемерное. Результаты его деятельности вполне можно пощупать и измерить. При моделировании для учета влияния интеллектуальных акторов на некоторый процесс достаточно ввести в той или иной форме стремление к целевому состоянию. 

В любом сколько-нибудь нетривиальном исследовании это фактически и делается. Это делается также и в биоинформатике, только по ряду причин (в том числе идеологических) об этом умалчивается.

No comments:

Post a Comment

Запись дня

Нерегулярность и неаддитивность функции

Claude Shannon by Alfred Eisenstaedt / The LIFE Picture Collection / Getty Рассмотрим стандартное возражение эволюционистов*, в котором утве...