Thursday, 22 May 2014

Утверждения теории распознавания паттернов искусственности

Недавно я получил ряд вопросов по поводу того, что же на самом деле утверждает ID. Благодарю за вопросы пользователей vyacheslav_fv и lantos. Еще раз перечислю основные определения и утверждения теории ID во избежание недоразумений.
  1. Функциональная информация I(f) относительно заданной функции f есть минус двоичный логарифм отношения Mf = Kf / N числа Kf конфигураций системы, совместимых с f, к числу N возможных конфигураций:

  2. I(f) = - log2 Mf = - log2 (Kf / N).

    • Mf ≤ 1, поскольку Kf < N.
    • При Mf = 1, все конфигурации равнозначны по отношению к f и никакая из них не несет функциональной информации (I_f = 0).
    • При Mf << 1 (как, например, в случае белковых конфигураций), конфигурации совместимые с f, несут статистически значимое количество функциональной информации.
  3. Главная гипотеза ID: cтатистически значимые количества функциональной информации (функциональной сложности) сообщаются системе только интеллектуально. Ни стохастика, ни закономерность, ни их комбинации не могут сообщить системе статистически значимого количества функциональной информации. Поскольку любой объект представим с использованием некоторого языка описания в виде строки символов, то часто удобно в качестве конфигураций рассматривать строки описания исследуемой системы на этом языке. С учетом сказанного, гипотеза 2 может быть переформулирована следующим образом. 
  4. Главная гипотеза ID (другая формулировка):  системы, описание которых на выбранном соответствующим образом языке превышает некоторый вполне определенный для них порог сложности, могли появиться только в результате осмысленной целенаправленной деятельности лица, принимающего решения. 
Примеры систем, характеризующихся статистически значимым уровнем функциональной сложности: осмысленный текст достаточной длины (например, "Война и мир"), персональные компьютеры и иные системы обработки информации, двигатели внутреннего сгорания, целый ряд белковых семейств, критически важных для существования известных науке форм земной жизни. 

Для того, чтобы фальсифицировать ID, необходимо опровергнуть главную гипотезу 2.

Пороговые значения (верхние оценки) сложности вычисляются для заданной системы на основе статистического анализа максимального числа возможных в этой системе конфигураций (взаимодействий), реализующихся "естественным" образом, неинтеллектуально, то есть без непосредственного участия лица, принимающего решения. 

Использование тех или иных оценок пороговых значений сложности, разумеется, влияет на точность результата. Более точные пороговые значения сложности приближаются сверху к реальному порогу сложности. Чем точнее оценка, тем меньше вероятность получения false negatives. Ложный отрицательный результат – всего лишь следствие ограниченной чувствительности метода, использующего оценки пороговой сложности. Это результат, при котором некоторая конфигурация, которая была сгенерированая интеллектуально, не распознается как таковая. 

Фальсификация ID – это предполагаемая демонстрация получения false positives при использовании методологии ID. То есть таких результатов, при которых "естественно", неинтеллектуально сгенерированные конфигурации ошибочно распознаются методологией ID как интеллектуально сгенерированные. 

Разберем конкретный пример. С учетом принятой на сегодня оценки возраста Земли в 4.5 миллиарда лет (порядка 1017 сек), максимальной известной скорости химической реакции (10-13 сек), и максимального числа молекул, могущих вступить в реакции в земных условиях (1040), число возможных химических взаимодействий составляет порядка 1040*1017/10-13 = 1070. Предположим теперь, что в какой-либо системе, изучаемой нами, из всех возможных 1070 конфигураций лишь одна реализует в системе некоторую функцию (это вполне реальные порядки величин при рассмотрении белковой функциональности, для сравнения 1080 – число атомов вещества в видимой части вселенной). Тогда количество ассоциированной с этой конфигурацией функциональной информации будет составлять примерно -log2 (1/1070) = 70 * log210 = 233 бит. 

Аналогично можно вычислить пороговые значения для биосферы, положив скорость репликации всех организмов максимально возможной (как у бактерий) и приняв некоторую верхнюю границу числа живых организмов на планете. Согласно К.Дерстону, пороговая информационная сложность для биосферы составляет примерно 140 бит. 

ID ничего не утверждает по поводу эволюции как таковой. Таким образом, возможность эволюционных изменений биосистем не оспаривается. Ставится под сомнение мощность эволюционных процессов (стохастика + закономерность) в смысле генезиса биологической новизны. Утверждается, что если эта новая функция требует сообщения системе статистически значимого количества функциональной информации, то эта функция должна была быть либо заложена в систему изначально, либо привнесена, но, что важно, она была реализована целенаправленно и интеллектуально. Главной задачей, таким образом, является измерение количества функциональной информации.

Метод К.Дерстона [Durston et al. 2007] состоит в измерении количества функциональной информации (единица измерения - функциональный бит, или фит) в целом ряде белковых семейств. Согласно методу, измерение производится в белковых молекулах по сравнению с "нулевыми" конфигурациями, характеризующимися полностью деградированной функцией. Вывод, сделанный К.Дерстоном и его коллегами таков: структура некоторых белков, критически важных для жизнедеятельности практически всех известных организмов (например, Ribosomal S12) несет в себе статистически значимые количества функциональной информации. Следовательно, эти белки дизайн-положительны, то есть высока вероятность того, что они имеют интеллектуальное происхождение.

Литература

No comments:

Post a Comment