Wednesday 6 October 2021

Физический смысл формулы Хейзена

Общие соображения

Обсуждаемая ниже формула была предложена Робертом Хейзеном для подсчёта количества функциональной информации в биологических системах. Вот статья, в которой это было сделано:

Здесь мы обсудим физический смысл этой формулы.

Предположим, у нас есть некоторая система, состоящая из ограниченного числа компонентов. Предположим также, что наша система может принимать состояния из заданного дискретного набора. Без потери общности будем считать, что определенное состояние отвечает определенному взаимному расположению компонентов системы. Пространством состояний в этом случае является пространство возможных взаимных расположений компонентов. На практике это число обычно очень велико. Понятно, что оно (супер)-экспоненциально возрастает с увеличением числа компонентов системы. Для иллюстрации достаточно вспомнить, что число перестановок n элементов некоторого множества составляет n! Далее, отметим, что часть состояний нашей системы может отвечать определенной функции, реализуемой только при тех или иных взаимных расположениях её компонентов. Взаимное расположение компонентов системы, отвечающее функции, называется организацией. С точки зрения физики, организация не что иное, как граничные условия на динамику градиентов вещества и энергии в системе.

Рассмотрим двигатель внутреннего сгорания (Рис.1). Он состоит из корпуса, блока цилиндров, коленчатого вала, распределительного вала, поршней, карбюратора, электрической части, крепежа, и пр. Можно оценить число различных состояний как число взаимных расположений деталей двигателя друг относительно друга. Из всего множества взаимных расположений деталей двигателя только одно предполагает возможность его правильной сборки и реализации его функции - преобразования энергии химических связей топлива в механическую энергию вращения коленвала.

Рис.1. Устройство двигателя внутреннего сгорания.
Источник: https://vodi.su/ustroystvo-dvs/
 


Те же самые соображения приложимы и к биологическим системам лишь с одним важным дополнением. Вследствие того, что число компонентов системы очень велико, а также в силу других важных особенностей белков - главного строительного материала живых существ, - биологическая функция, являясь дискретной в малом, допускает существование уровней в большом, "размывая" понятие дискретности в масштабах системы. Использование макромолекул с сильными и слабыми связями, позволяющими осуществлять многоуровневую укладку, кстати, было одним из замечательных инженерных решений Творца биосистем. Оно позволило достичь компромисса между варьируемостью активности 3-мерной молекулы за счёт использования слабых связей между частями макромолекулы, и заданностью наследуемой первичной структуры, обеспечиваемой её сильными связями. Например, возможность вступать в определенное белковое взаимодействие доставляется обычно более чем одним состоянием компонентов системы, причем сама возможность взаимодействия характеризуется различными уровнями, изменяясь от 0 до 100% при изменении состояния системы.

Рис. 2. Целевое пространство Tf является подпространством пространства S возможных состояний системы. В каждом состоянии из Tf система реализует функцию f.


Формула Хейзена — мера функциональной информации, ассоциированной с системой, находящейся в заданном состоянии

Формула Хейзена представляет собой меру функциональной информации:

Kf = –log2 ( |Tf| / |S| ).
Здесь:
  • Kf: количество функциональной информации, ассоциированной с некоторой заданной функцией f (например, способностью двигателя внутреннего сгорания преобразовывать химическую энергию в механическую, способностью белка вступать во взаимодействие с ферментом, инфективностью бактериофага и т.д.);
  • |X|: мощность (число элементов) множества X;
  • S: пространство дискретных состояний некоторой системы (например, пространство возможных взаимных конфигураций деталей двигателя или Lego блоков, пространство возможных нуклеотидных или аминокислотных строк заданной длины и т.д.);
  • Tf: целевое подпространство, или пространство состояний системы, в каждом из которых система реализует функцию f. По определению, Tf ⊆ S (рис.2).

 

Физический смысл (интерпретация) формулы Хейзена

Отношение |Tf| / |S| соответствует вероятности попадания в целевое подпространство при случайном выборе состояния рассматриваемой системы (при условии равной вероятности реализации любого состояния).

Технически –log2 берётся для того, чтобы эту вероятность "перевести" в биты: основание логарифма = 2 - "приведение" к ситуации с бросанием сбалансированной монетки, а минус присутствует для того, чтобы получать неотрицательные значения Kf, ведь логарифм правильной дроби < 0. Cамо Kf интерпретируется как количество бит, получаемых наблюдателем при реализации системой одного из функциональных состояний; или иначе, количество функциональных бит, соответствующее состоянию из Tf; иначе: количество функциональной информации, необходимой для того, чтобы указать (представить на некотором языке описания) одно из целевых состояний.

И последнее замечание. Понятно, что так как множество Tf не пусто и Tf ⊆ S, получим 0 < |Tf| / |S| ≤ 1. Ясно, что при фиксированном S максимум функциональной информации мы получаем в случае, когда |Tf| = 1, то есть когда из всего пространства конфигураций только одна конфигурация реализует f. Это случай максимальной специфичности f в системе. Напротив, количество функциональной информации минимально (равно 0) в случае, когда |Tf| / |S| = 1. В этом случае целевое пространство совпадает с S, любое состояние является функциональным, а функция f минимально специфична.

Отдельный интересный и тяжелый вопрос — генезис cложной функции. Этот вопрос связан с утверждением о дизайне и с тем, корректно ли утверждать, что практическая невозможность случайного попадания в функциональную зону в реальности означает высокую вероятность дизайна функции или, напротив, мы имеем дело с ошибкой "техасского стрелка", когда мишень рисуется после выстрела?

No comments:

Post a Comment

Запись дня

Нерегулярность и неаддитивность функции

Claude Shannon by Alfred Eisenstaedt / The LIFE Picture Collection / Getty Рассмотрим стандартное возражение эволюционистов*, в котором утве...