Размер шрифта
-
+

Рассказ предка. Паломничество к истокам жизни - стр. 76



{“Британская библиотека” + “Эджертон”} и (“Крайст-Черч” + “Хенгурт”}


Эти признаки выделены первой, третьей, седьмой и восьмой вертикальными линиями. Пятый признак – косая черта – выделен двенадцатой вертикальной линией. По этому признаку манускрипты подразделяются на другие группы:


{“Британская библиотека” + “Хенгурт”} и {“Крайст-Черч” + “Эджертон”}


Полученные результаты противоречат друг другу. Мы не можем построить древо, в котором каждое изменение отображалось бы лишь один раз. Самым приемлемым окажется древо, изображенное ниже (заметьте – оно неукорененное). Эта схема сокращает противоречия до минимума: мы повторно учитываем лишь один признак – косую черту.



Вообще-то я не уверен, что мы сделали правильное предположение. В текстах часто встречаются совпадения и реверсии, особенно если смысл строк при этом не меняется. Средневековый переписчик наверняка не испытывал угрызений совести, изменяя написание, и еще меньше его волновали вставки или удаления знаков, например косой черты. В этом случае информативнее такие изменения, как перестановка слов. В генетике аналогами таких изменений являются “редкие геномные изменения”: крупные вставки, делеции и дупликации ДНК. Мы можем оценить информативность, присвоив большее или меньшее значение (вес) различным типам признаков. Недостоверные или слишком частые изменения при подсчете будут иметь меньший вес. А редкие изменения, которые служат надежными показателями родства, – больший вес. Повышенный вес признака говорит о том, что мы не хотим учитывать его дважды. Таким образом, наиболее экономное древо – то, которое имеет наименьший общий вес.

Метод парсимонии широко используется для поиска эволюционных деревьев. Но в том случае, когда конвергенций и реверсий слишком много – а это случается и с последовательностями ДНК, и с текстами Чосера, – метод парсимонии может оказаться недостоверным. Эта проблема известна как “эффект притяжения длинных ветвей”.

Кладограммы – как укорененные, так и неукорененные – отражают лишь порядок ветвления. Филограммы, или филогенетические деревья, похожи на кладограммы, но в них длина ветвей несет дополнительную информацию. Обычно длина ветвей отражает эволюционное расстояние: длинные ветви обозначают крупные изменения, а короткие – мелкие. На основе первой строки “Кентерберийских рассказов” можно построить следующую филограмму.



Здесь длина ветвей не слишком различается. Но представьте, что будет, если два манускрипта сильно отличаются от двух других. Тогда ветви первых манускриптов будут очень длинными. Однако изменения могут оказаться не уникальными. Изменения могут случайно оказаться идентичными изменениям в другом месте древа. Но с наибольшей вероятностью (именно в этом заключается проблема) они совпадут с изменениями на другой длинной ветви. Ведь длинные ветви – это те, в которых произошло наибольшее число изменений. И если изменений окажется слишком много, две длинные ветви на филограмме будут отображаться как родственные, даже если это не так. Таким образом, метод парсимонии, основываясь на простом подсчете изменений, может ошибочно сгруппировать две самые длинные ветви, “притянуть” их друг к другу.

Эффект притяжения длинных ветвей – серьезная помеха для систематики. Он проявляется везде, где много конвергенций и реверсий. К сожалению, эту проблему нельзя решить простым увеличением объема рассматриваемого текста. Наоборот, чем больше текст, тем выше вероятность обнаружения случайных совпадений. Про такие деревья говорят, что они лежат в “зоне Фельзенстайна” (звучит устрашающе!), названной в честь американского биолога Джо Фельзенстайна. Увы, ДНК особенно подвержена эффекту притяжения длинных ветвей. Основная причина в том, что в ДНК всего четыре “буквы”. Поскольку большинство изменений затрагивают всего одну “букву”, случайные мутации с высокой вероятностью могут привести к совпадениям. Так возникает притяжение длинных ветвей. Очевидно, что для таких случаев нужна альтернатива методу парсимонии. Она существует – это метод правдоподобия. В последнее время он используется все чаще.

Страница 76