Combining and congruence evaluation of phylogenetic signals from different genes based on geometric approach
Author(s) -
В. М. Ефимов,
V. Yu. Kovaleva,
Yu. N. Litvinov
Publication year - 2016
Publication title -
vavilov journal of genetics and breeding
Language(s) - English
Resource type - Journals
SCImago Journal Rank - 0.188
H-Index - 7
eISSN - 2500-0462
pISSN - 2500-3259
DOI - 10.18699/vj16.153
Subject(s) - congruence (geometry) , euclidean distance , euclidean space , phylogenetic tree , centroid , distance matrix , distance matrices in phylogeny , mathematics , biology , combinatorics , genetics , gene , geometry
A new Euclidean distance based algorithm is used for analysis of congruence and combining molecular genetic data. This approach is called geometric, since Euclidean distance satisfies all metric axioms and the points representing the sequences can be placed in a geometric space without distorting the mutual distances and can be endowed with the coordinates in this space. Geometricness of Euclidean distances allows methods of multivariate analysis to be applied to molecular data, which is relevant to intraand inter species variability investigating, visualization of possible directions of evolution, combining data and evaluation of the congruence of phylogenetic signals. The algorithm is used for the analysis of more than 1 500 nucleotide sequences of two nuclear (apoB, brca1) and two mitochondrial (co1, cytb) genes of 15 Palaearctic and Nearctic shrew species of the genus Sorex (Soricidae, Eulipotyphla). All sequences of each gene are represented as a set of points in Euclidean space. Centroids of a set of points belonging to the same species are calculated. The matrix of Euclidean distances between the species centroids is calculated for each gene. Mantel test is applied to estimate pairwise similarity (congruence) of interspecies distances matrices relating to different genes. nDNA gene congruence is 0.961, that of mtDNA is 0.748. All matrices of the interspecies distances are combined into a joint matrix by weighing. Joint genetic space for all species is built by principal coordinate method from the joint matrix. Several variability directions reflecting evolutionary events of different scale are visualiz ed in a joint genetic space. In addition, the joint matrix of interspecies distances is used for building a Рассмотрены возможности недавно предложенного нами нового алгоритма (DJ-метода) для анализа конгруэнтности и комбинирования молекулярно-генетических данных на основе матриц евклидовых расстояний. Этот подход назван геометрическим, поскольку евклидовы дистанции удовлетворяют аксиомам метрики, что обеспечивает возможность помещения множества точек, представляющих последовательности, в некоторое геометрическое пространство без искажения взаимных расстояний и наделения точек этого множества координатами в пространстве. Геометричность евклидовых расстояний позволяет применять к молекулярным данным весь арсенал методов многомерного анализа, что является актуальным для исследования соотноше ния внутрии межвидовой изменчивости, вычисления центрои дов таксонов и расстояний между ними, визуализации возмож ных направлений эволюции, комбинирования и оценки конгруэнтности филогенетических сигналов, относящихся к разным генам и даже к разным системам признаков. DJ-метод использован для оценки конгруэнтности и комбинирования филогенетических сигналов, получаемых от нескольких генов. Анализировались более 1500 нуклеотидных последовательностей двух ядерных (apoB, brca1) и двух митохондриальных (co1, cytb) генов 15 палеарктических и неарктических видов землероек-бурозубок рода Sorex (Soricidae, Eulipotyphla). Для каждого гена все его последовательности представлялись множеством точек в евклидовом пространстве. Для множества точек, относящихся к одному виду, вычислялся его центроид в этом же пространстве, а для каждого гена – матрица евклидовых расстояний между центроидами видов. Для оценки попарного сходства (конгруэнтности) матриц межвидовых расстояний применен тест Мантеля. Конгруэнтность генов яДНК составила 0.961, мтДНК – 0.748. Все матрицы межвидовых расстояний через взвешивание объединены в единую матрицу, по которой методом главных координат для всех видов построено единое пространство. В объединенном генетическом пространстве проявилось несколько направлений межвидовой изменчивости, отражающих разные по масштабу эволюционные события. По объединенной матрице межвидовых расстояний построено дерево, которое хорошо согласуется с принятой на сегодня зоологической систематикой. Это подтверждает работоспособность предложенного метода.
Accelerating Research
Robert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom
Address
John Eccles HouseRobert Robinson Avenue,
Oxford Science Park, Oxford
OX4 4GP, United Kingdom