Monday, 19 June 2023

Нерегулярность и неаддитивность функции

Claude Shannon
by Alfred Eisenstaedt / The LIFE Picture Collection / Getty

Рассмотрим стандартное возражение эволюционистов*, в котором утверждается результативность путешествия в пространстве параметров дарвиновским способом с возрастанием сложности функции.

------ 

* Или, как я их называю, самособойщиков, верящих в то, что всё, что мы наблюдаем вокруг, включая биологическое разнообразие, сформировалось по мановению волшебной палочки само собой. Разумеется, при этом произносятся какие-то дежурные слова типа "при определённых начальных/граничных условиях под действием физических законов". Однако весь вопрос и заключается как раз в этих самых начальных и граничных условиях на движение материи. Дело в том, что они настолько специфичны и настолько сложны, что само собой-то как раз и исключено и что они вполне однозначно указывают на неоднократную интеллектуальную настройку, или, выражаясь в терминах игры Жизнь, на то, что как правила, так и начальные условия неоднократно целенаправленно усложнялись.  

------

Напоминаю, что мы согласились называть сложной биологическую функцию, количество которой в некоторой биологической системе (например, в линейной структуре белка), превышает эмпирически установленную границу эволюционных возможностей в 140 функциональных бит (что соответствует 2140 событиям размножения, то есть числу состояний, доступных для просмотра эволюцией). Всё, что менее 140 функциональных бит, мы классифицируем как достижимое эволюционными движениями биоты*. 

------  

* Пояснения к данному методу классификации биологической функции по критерию дизайна, предложенному биологом Дж. Пуччио, см. в этой записке. Особенно важно понять, как вопрос о числе состояний, доступном эволюции, связан с количеством функциональной информации, способной генерироваться эволюционно. Читателям, интересующимся подробностями, порекомендую также эту запись. Интересно отметить, что Дж. Пуччио исходит из распространённых неодарвинистских предположений о происхождении биологических видов от общего предка (или небольшого числа общих предков) с модификацией (a common descent with modification), правда, в отличие от дарвинистов, на основе предложенной им оценки максимального числа состояний, доступных для эволюционного поиска, и статистического анализа гомологичности линейной структуры белков автор приходит к выводу о том, что главным источником генетических модификаций является разум, а не случайность (даже в комбинации с естественным отбором). О том, что в дарвинистской парадигме единственным фактором, ответственным за появление новизны, является случайность, см. ниже.

 

Функция, в том числе биологическая, -- одно из основных понятий в распознавании дизайна.

  • Примером биологической функции является способность белков вступать в химические взаимодействия, зависящая от последовательности аминокислот в первичной (линейной) структуре белковых молекул.
Здесь мне хотелось бы изложить некоторые соображения по вопросу функции и функциональной информации. О функции удобнее всего рассуждать в языковом контексте: в предположении о существовании языка и инструкций на этом языке, получаемых и обрабатываемых исследуемой нами системой. Важным мотивационным моментом в нашем разговоре является теоретический вывод биофизика Х. Патти о том, что системы с иерархическим управлением, в частности, биологические по необходимости являются лингвистическими, то есть в таких системах используется язык.
 
Функциональная информация и информация Шеннона
 
Первое, на что нужно обратить внимание, — это слабая применимость информационной модели Шеннона в анализе биологических структур. Довольно странным мне представляется то обстоятельство, что теоретически с этим положением согласны все квалифицированные самособойщики, однако почти никто из них не возражает при этом против повсеместного использования шенноновской модели.
  • Claude Shannon: A mathematical theory of communication, a corrected version of the ogiginal publication in: The Bell System Technical Journal, Vol. 27, pp. 379–423, 623–656, July, October, 1948.
Давайте вспомним, чем функциональная информация отличается от информации Шеннона. Лучше всего это показать на примере.  
 
Пример 1. 
 
Дан булев алфавит K = {0,1} и строка s длиной L = 32 символа: 01001111001010111100111000011001. Размер алфавита обозначим |K|. В данном случае |K| = 2.
  • Количество информации Шеннона в строке s: Ish(s) = 32 бита. Это значение соответствует предположению о том, что любой символ сообщает приёмнику одинаковое количество информации (то есть что появление любого символа в строке равновероятно). Таким образом, значение, полученное для всей строки, зависит только от её длины и не зависит от содержимого строки. Этого и следовало ожидать, так как модель Шеннона была разработана для решения проблем, связанных с передачей сообщений, независимо от их содержимого.
    • Информационная энтропия H(X) случайной переменной Х в модели Шеннона вводится как сумма по всем возможным значениям случайной величины: H(X) = —Σpilog2pi, где pi - вероятность события, при котором X принимает i-е значение из n теоретически возможных. H(X) отражает количество информации, сообщаемой наблюдателю при реализации этого события. Функция H(X) достигает максимума при условии равной вероятности реализации возможных значений X. В том случае, когда множество возможных значений Х содержит всего два элемента (например, при броске монеты множество возможных исходов выглядит так: {"орёл", "решка"}), максимум функции H(X) отвечает вероятности каждого исхода, равной 1/2, и составляет 1 бит (см. график ниже, взятый отсюда).


  • Функциональная информация вводится для решения задач интерпретации сообщений. Количество If функциональной информации зависит от того, какова рассматриваемая нами функция. If отражает смысл сообщения, который определяется как локальная функция информационного контекста.
    • В контексте действий пользователя по аутентификации в некоторой информационной системе, строка s может служить ключом. В таком случае s сообщает системе функциональную информацию. Количество ф.и., вычисленное по формуле Хейзена в упрощающем предположении, что все возможные строки имеют одну и ту же длину L, составляет:
    • If(s) = —log2(M/|K|L) = —log2(1/|K|L) = L * log2|K|, где М = 1 число синонимов s, то есть строк, имеющих такой же смысл, как и s.
    • Таким образом, в данном случае количество функциональной информации: If(s) = L * log2|K| = 32 * log2 2 = 32 функциональных бита.
    • Стоит обратить внимание на несколько важных моментов:
      • Величина под логарифмом может быть интерпретирована как вероятность попадания строкой s в функциональную область пространства возможных строк. Чем меньше это значение вероятности, тем большее количество функциональной информации получает приёмник вместе со строкой s. Подробнее св. в другой записке.
      • Единица в числителе дроби (M = 1) под логарифмом отражает единственность аутентификационного ключа среди множества возможных строк данной длины, а размер множества возможных строк |K|L находится в знаменателе этой дроби.
      • Существование M > 1 функциональных синонимов снижает количество функциональной информации в строке.
      • Отметим также, что удельное количество функциональной информации на позицию строки Ifуд(s) = If(s)/L и в данном случае составляет Ifуд(s) = 1 функциональный бит. Теоретический максимум Ifуд зависит лишь от размера алфавита: max(Ifуд) = log2|K|.
        • Для булева алфавита: max(Ifуд) = log2|K| = log2 2 = 1 функциональный бит. Таким образом, для булева алфавита удельная функциональная информация заключена в интервале от 0 до 1: 0 ≤ Ifуд. ≤ 1.
        • Для алфавита размером |K| удельная ф.и.: 0 ≤ Ifуд. ≤ log2|K|. Например, линейные структуры белков представляют собой строки аминокислотного алфавита, размер которого |K| = 20, поэтому для них справедливо: 0 ≤ Ifуд. ≤ log220.
      • Наконец, в случае, когда смысл имеет лишь некоторая подстрока строки s, справедливо: Ifуд(s) < max(Ifуд). Для булевой строки, соответственно: Ifуд(s) < 1.
    • Вне подобного контекста, включающего обработку строк данных с какими-то осмысленными действиями в отклик на полученные данные, количество функциональной информации в строке s составляет If(s) = 0. Попросту говоря, каков бы ни был набор данных, без соответствующего интерпретатора он не имеет никакого смысла.
Из примера 1 видно, что при фиксированном алфавите количество функциональной информации зависит от рассматриваемой функции f, от содержимого строки и, наконец, от числа синонимов, кодирующих f. Функциональная информация может меняться в пределах от нуля до теоретического максимума (шенноновское значение), который, в свою очередь, зависит от выбора алфавита и длины строки. Итак, в общем случае:
  • If ≤ Ish.
Чтобы подчеркнуть это неравенство, некоторые авторы используют понятие фита, т.е. функционального бита (англ. fit, functional bit). 
 
Реальные возможности незатейливой схемы RV+NS в смысле генерации функциональной новизны  
 
Следующее соображение заключается в принципиальной возможности возрастания функциональной сложности в результате действия дарвиновского механизма RV+NS. C этим никто не спорит. Никто не спорит также с утверждением о том, что метрики фазовых пространств генотипов и фенотипов различны, и поэтому то, что "далеко" в пространстве фенотипов, может оказаться "близким" в пространстве генотипов. Тем не менее, весь вопрос состоит в том, насколько широки практические возможности эволюции по увеличению биологической функции. 
 
Действие отбора налагает в этом смысле серьёзные ограничения на предполагаемый процесс селективного функционального усложнения: каждый промежуточный пункт дарвиновской фазовой траектории должен быть виден отбору в статистическом смысле. Вся сложность обычно зарыта именно в деталях, до которых мало кто докапывается, а научная картинка транслируется публике в победном ключе: 
 
«Pаз теоретически возможно, значит так оно и было». 
 
Теории разные бывают. На практике же эволюционный механизм обладает определёнными возможностями, которые не нужно переоценивать. Для закрепления мутации X в популяции необходимо обеспечить не просто её появление, но селективное преимущество, то есть мутация X должна каким-то образом возникнуть в значительной доле особей (чем значительнее доля, тем выше вероятность закрепления X). Иначе отбор на практике её просто не заметит. Однако эта доля обычно ограничена зашумлением: например, возникновением других полезных, с точки зрения репродуктивного преимущества, мутаций. Может получиться так, что различные полезные мутации взаимно ослабляют селективные преимущества друг друга в процессе закрепления. Необходимо также помнить о действии так наз. случайного отбора (например, дрейфа генов), который способен перебороть действие естественного отбора. Потеря полезных мутаций вследствие дрейфа генов — вполне реальная вещь (подробнее — см. записку "Банкротство игрока — банкротство Дарвина"). 
 
Эволюционисты занимаются научным фантазированием, когда говорят, что дарвиновским способом можно достичь развития функциональной сложности. Дарвиновский механизм обеспечивает лишь фиксацию мутаций, полезных с точки зрения репродуктивного преимущества, будучи зависим от появления этих самых мутаций в популяции. Развитие функции предполагает параллельное развитие информационного контекста, в котором эта функция может существовать. 
 
Предположим, у вас случайным образом появилась мутация, которая могла бы соответствовать какой-то сложной функции, однако если информационный контекст, то есть возможности интерпретатора, не соответствует сложности функции, мутация будет потеряна. Функциональная информация в достаточных количествах генерируется в реальности только интеллектуально, потому что интеллект в своей творческой активности не связан ограничениями чувствительности, необходимости фильтрации шумов и пр. Селекционер гораздо эффективнее естественного отбора, потому что он, зная заранее, чего он хочет добиться, может отобрать едва заметный признак, тогда как естественному отбору необходимо иметь данный признак в значительной части особей популяции, для того, чтобы он хотя бы начал работать. Вот в этой недооценке эффективности искусственной направленной селекции и заключается, на мой взгляд, критическая ошибка Ч. Дарвина и его последователей.  
 
Нерегулярность функциональных конфигураций материи 
 
Далее, функция как таковая, а тем более сложная, ассоциирована с нерегулярными структурами. Интуитивно понятно, что регулярные (сильно сжимаемые) структуры не имеют большой информационной ёмкости: например, количество информации, которое можно сообщить мычанием, блеянием, сиреной, или повторением одной-двух букв, относительно мало. С другой стороны, распределение частот букв в литературном тексте, далеко от равномерного:
  • Регулярная строка: АААААААААААААА
  • Нерегулярная строка: Нерегулярная строка
Регулярные структуры встречаются в природе повсеместно: от интерференционных паттернов, до дюн, конвекционных ячеек Бенара и таких экзотических феноменов, как реакция Белоусова-Жаботинского (так наз. химических часов). Таким образом, регулярность, или, иными словами, следствие действия естественных природных закономерностей, — киллер информации. Поэтому единственным источником информации, по логике эволюционной теории, может быть только случайность. Других источников генерации информации у самособойщиков не предусмотрено. Заявления дарвинистов о творческой роли отбора или среды являются лирикой и не соответствуют действительности. В реальности сложная функция возникает в природе не случайно, но только интеллектуально. Это самое слабое место в системе их представлений, так как единственным достоверно известным источником функциональной информации является интеллект агента, или лица, принимающего решения.  
 
Неаддитивность функции 
 
Функция не является аддитивной величиной, биологическая функция в том числе. Нельзя дарвиновским способом пропутешествовать от велосипеда до самолёта, то есть так, чтобы все промежуточные пункты предоставляли бы селективное преимущество настолько, чтобы за них мог бы зацепиться отбор. Конечно, биологическая функция имеет своего рода уровень, что можно оптимизировать в некоторых пределах: динамически управлять, приглушать или усиливать. Используя ту же аналогию, скажем, что можно управлять «велосипедной» или «самолётной» функцией. Однако сама биологическая функция дискретна, так сказать, «в большом»; в том смысле, что пики функции крайне редки и разнесены по пространству. Отбор включается только когда система находится вблизи пика. В реальности пропутешествовать в пространстве генотипов дарвиновским способом от одной фенотипической функции к другой весьма проблематично. В теории можно, на практике же этого не происходит. Как я вижу, этому есть две причины.

Во-первых, в существующей на данный момент реальности природа всегда идёт по пути распада, деградации, стремится к всевозможным равновесным состояниям, включая смерть. Мы не будем здесь вдаваться в вопрос, откуда смерть в мироздании, поскольку это выходит за рамки данной записки. Сейчас для нас важно понимать, что смерть де-факто имеется и что она как распад и стремление к термодинамическому и химическому равновесию является одним из проявлений всеобъемлющего феномена: второго начала термодинамики. В том, что касается функции, эволюция как изменение частот аллелей в популяции также идёт по пути распада: удачные в смысле репродуктивного преимущества поломки генов могут закрепляться в популяции, в результате чего изначально заданная функция деградирует.

Только пусть уважаемый читатель не спешит инкриминировать мне утверждение о том, что эволюция противоречит второму началу. Формального противоречия нет, но со статистической точки зрения, проявляемая в эволюционной динамике тенденция «в большом» соответствует именно деградации функции. Эволюционное возрастание сложности функции, превышающее практическую границу в 140 функциональных бит, не наблюдается. Поэтому в случаях, где при сравнительном анализе биологических структур пост-фактум наблюдается информационная дельта, превышающая 140 функциональных бит, мы не имеем права интерпретировать её в эволюционном ключе, поскольку такие значения выходят за рамки возможностей дарвиновской эволюции. Да и нейтральной тоже, так как в нейтральной модели источник появления информационной новизны, как и у Дарвина, один-единственный: случайность.

Второй причиной невозможности практической реализации дарвиновского механизма возрастания функциональной сложности является крайняя разрежённость (sparsity) функции в пространстве параметров: чем больше функциональная сложность, тем большая специфичность информационно-несущих структур, тем они реже в пространстве параметров. Например, забить гвоздь можно много чем: от камня до молотка. В то же самое время, для вычисления логарифма с заданной точностью требуются весьма специфичные функциональные конфигурации материи: логарифмическая линейка, калькулятор, персональный компьютер, да, вероятно, и всё. Думаю, что читателю ясно, что точки в пространстве всех возможных конфигураций материи, соответствующие таким конфигурациям, весьма редки и разнесены друг от друга. В общем случае для того, чтобы сделать выборку с относительно большой долей функциональных состояний, нужен всё тот же интеллект, против необходимости которого так возражают наши друзья самособойщики.
 
 
Естественный отбор не выход для самособойщиков при объяснении генезиса сложной функции

И, наконец, последний момент: отбор происходит не по критерию сложности будущей функции, а по критерию репродуктивного преимущества. Поэтому, с точки зрения ненаправленной эволюции, каковая мыслилась Дарвину и его сторонникам, трата драгоценных ресурсов предпочтительнее в сторону адаптационной деградации уже имеющейся функции. Так оно и происходит: до новой функции далеко, а имеющаяся мутировала так, что с поломкой рождается больше особей. Насколько я знаю, полевых доказательств эволюционного возрастания функции до наблюдаемых in vivo значений не зафиксировано. Экспериментально продемонстрировано, что отбор может оптимизировать функцию только до определённого предела, а дальше он застревает в локальных оптимумах. Но что касается поиска новой функции, то никаких лабораторных подтверждений этому нет (с экспериментом Ричарда Ленски, предназначенным для демонстрации именно этого, вышел конфуз, пополнивший список эпических фиаско дарвинистов). Спрашивается: откуда взялась та функция, что уже есть, ведь если эволюция и идёт на практике, то только по пути деградации функции? Естественно, появиться она могла только посредством интеллектуальной загрузки, но на это, самособойщики, понятное дело, согласиться не могут.

No comments:

Post a Comment

Запись дня

Нерегулярность и неаддитивность функции

Claude Shannon by Alfred Eisenstaedt / The LIFE Picture Collection / Getty Рассмотрим стандартное возражение эволюционистов*, в котором утве...