Рассказ предка. Паломничество к истокам жизни - стр. 77
Оценка правдоподобия требует больше вычислительных мощностей, чем метод парсимонии, поскольку здесь мы учитываем длину ветвей. Таким образом, приходится иметь дело с еще большим количеством деревьев: вдобавок к рассмотрению возможных схем ветвления мы должны учитывать возможные длины ветвей. Геркулесов труд! Поэтому, несмотря на упрощенные методы вычисления, компьютеры пока могут подвергнуть анализу небольшое количество видов.
Термин “правдоподобие” здесь имеет вполне точное значение. Возьмем древо определенной формы (с учетом длины ветвей). Из всех возможных эволюционных траекторий, посредством которых может сформироваться филогенетическое древо данной формы, всего несколько могут привести к тому тексту, который мы сейчас видим. "Правдоподобие” данного древа – это ничтожно малая вероятность получения реально существующих текстов, а не каких-нибудь текстов, которые могут появиться на таком древе. Величина правдоподобия для древа очень мала, однако это не мешает сравнить одну малую величину с другой, чтобы выбрать нужную.
Неукорененное филогенетическое древо первых 250 строк 24 списков "Кентерберийских рассказов". Здесь представлен набор списков, изученный в рамках проекта "Кентерберийские рассказы". Сокращения соответствуют тем, что использованы в проекте. Схема построена методом парсимонии, на каждой ветви указаны индексы бутстреп-поддержки. Для четырех списков, которые обсуждаются нами, указаны их полные названия.
Выбирать "лучшее” древо методом правдоподобия можно по-разному. Самый простой способ – искать наиболее правдоподобное древо. Это метод максимального правдоподобия. Однако то, что это наиболее правдоподобное древо, вовсе не означает, что другие деревья не окажутся почти столь же правдоподобными. Совсем недавно было предложено не искать одно самое правдоподобное древо, а рассматривать все возможные. При этом степень "доверия” к древу должна зависеть от его правдоподобия. Этот подход представляет собой альтернативу методу правдоподобия и известен как байесовский метод. Если схема ветвления подтверждается большим количеством правдоподобных деревьев, мы заключаем, что эта схема с высокой вероятностью верна. Конечно, как и в методе максимального правдоподобия, мы не можем проверить все деревья. Но существуют способы упрощения вычислений, и они довольно неплохо работают.
Степень нашего доверия древу, которое мы в итоге выберем, зависит от того, насколько мы уверены в правильности каждого разветвления. Поэтому возле точек ветвления часто указывают степень “уверенности” в них. При использовании байесовского метода правдоподобие точек ветвления вычисляется автоматически, однако для других методов, таких как парсимония или максимальное правдоподобие, необходимы альтернативные способы подсчета. Чаще всего используют метод бутстрепа: многократно обсчитываются выборки данных, и оценки сравниваются с результатами для всего древа. Так мы можем понять, насколько древо устойчиво к ошибкам. Чем больше индекс бутстреп-поддержки, тем надежнее точка ветвления. Правда, точно интерпретировать полученные индексы бывает непросто. По сходному алгоритму работают методы “складного ножа” (jackknife) и “поддержки Бремера”. Все они служат для оценки достоверности точек ветвления.