Thursday, 13 November 2014

Профессорский трюк как иллюстрация возможностей ID

Уильям Дембски приводит в своей книге "No free lunch: Why Specified Complexity Cannot Be Purchased Without Intelligence" интересную практическую иллюстрацию принципиальной возможности распознавания дизайна, то есть чьих-то целенаправленных действий.

Профессор статистики на первой лекции предлагает провести опыт и говорит студентам следующее:

— Я выйду на 10 минут из аудитории. Тем временем каждый из вас пусть запишет результаты 100 бросков монетки. Каждый должен либо честно провести 100 бросков и записать их результаты (орел или решка), либо выдумать эти результаты из головы и также записать на листке. Я прихожу и собираю листочки. Не спрашивая, каков был выбор каждого, я берусь отгадать, глядя на записи в каждом листке, кто честно производил эксперимент, а кто подделал результаты.

Смысл фокуса в том, что в реальной жизни из 100 бросков по статистике должны встретиться блоки, содержащие 7 повторений орлов или решек. Это, в принципе, легко показать. При условии случайного распределения орлов и решек вероятность того, что следующий бросок завершится так же, как и предыдущий, равна 50%. То есть вероятность встретить блоки из двух орлов или двух решек подряд равна 50%, вероятность встретить блок из трех повторений — ровно половина от 50%, то есть 25%, четырех — 12.5%, пяти — примерно 6%, шести — примерно 3%, семи — примерно 1.5% (то есть из ста в среднем однажды должен встретиться такой блок) и т.д. Расчет профессора — на то, что студенты еще этого не знают.

Я провел эксперимент для интереса. Вот что я получил:

OOPPOPOPPO
OPOOPPPOPO
PPOOOPPPPP
POPOPPOOPP
PPPPPPOOOP
OPOPOPOOPO
POOOOPOPPP
OOPPOOPPOO
OPOPOPPPPO
PPPOPOPPOP

Здесь встретилось:

  • 44 блока (орлов или решек) длиной 2;
  • 20 блоков длиной 3;
  • 10 блоков длиной 4;
  • 6 блоков длиной 5;
  • 2 блока длиной 7;
  • 1 блок длиной 8.

Подсчет ведется так. Если встречается блок PPP или OOO, то в каждом из них по два блока длиной 2.

Человек, решивший имитировать процесс и не знающий статистики, будет психологически стремиться искажать эти частоты, приближая их к тому, что в его представлении наиболее соответствует случайному процессу. Это искажение можно выявить чисто статистическим анализом в предположении о том, что процесс бросания монеты в отличие от имитации по своим частотным характеристикам близок к случайному.

Главный вывод: иногда можно очень много полезного извлечь исключительно из имеющейся конфигурации пост-фактум. Для этого не обязательно иметь возможность наблюдать сам процесс.

Так можно на практике, например, выявить с приемлемой вероятностью, является ли та или иная новость информационным вбросом. Принципы распознавания применяются в медицине, криминалистике, социологии и в др. областях.

Почему ж мы не можем проанализировать биологические структуры, используя тот же статистический подход?

No comments:

Post a Comment