[eng] Phylogenetics is the study of evolutionary history and relationships among species, and
in particular, its reconstruction from biological data. It plays an important role in understanding
biology because it allows to stablish the relationships between organisms. Based
on Darwin's theory, which states that all species have evolved from a common ancestor,
evolutionary histories have been represented using trees. However, when non-vertical evolutionary
events such as hybridizations, recombinations and lateral transfer of genes occur,
the use of phylogenetic networks is indeed more appropriate than trees in order to model
those reticulate evolutionary histories.
The main motivation of this thesis is to develop a new model for phylogenetic networks
modelling evolutionary histories with lateral gene transfers, as well as computational methods
and algorithms for their reconstruction.
The new model we propose, which we call LGT networks, captures the asymmetry of
lateral gene transfer events. The model is based on considering a principal tree that
represents the main line of evolution of the considered species, and a set of arcs modelling
lateral transfer events. Our LGT networks generalizes some other existent models which
were designed for a similar purpose.
We solve the well-known phylogenetic network reconstruction problem for the abovementioned
LGT networks from induced sets of trees and trinets. Both cases require some
topological constraints to be imposed in order to obtain unicity of solutions, which is lost
when considering generic LGT networks.
We reconstruct such networks from a set of trees formed by a principal tree and a set
of secondary subtrees, being each of these secondary subtrees associated to a speci c
secondary arc. To do this, we propose a polynomial algorithm, which we applied to real
biological data sets in order to predict or discover lateral transfer events. We also study the
reconstruction problem from a set of \basic" LGT networks on three leaves and with only
one secondary arc. We call such networks tri-lgt-nets, which are similar to the well-known
trinets. With this, we contribute to extend the set of possible phylogenetic networks that
can be recovered using the previous substructures.
Finally, we extend the framework for the reconciliation problem between gene trees and
species trees using LGT networks as the species phylogeny. In order to set up the evolutionary
scenario, we allow transfer events via secondary arcs of the network only, as
well as duplications and losses. For this model, we present fast computational algorithms
addressed to obtain the most parsimonious reconciliation between a gene tree and an LGT
network.
[cat] La logen etica es l'estudi de les hist ories evolutives i les relacions entre esp ecies, i en
particular la seva reconstrucci o a partir de dades biol ogiques. Aquesta juga un paper
important en la comprensi o de la biologia, ja que permet determinar les relacions de
parentiu entre organismes. Basant-se en la teoria de Darwin, la qual defensa que totes
les esp ecies han evolucionat d'un ancestre com u, les hist ories evolutives s'han representat
emprant arbres. No obstant aix o, quan ocorren processos evolutius no verticals tals com
hibridacions, recombinacions i transfer encies laterals de gens, l' us de xarxes logen etiques
es, certament, m es apropiat que l' us d'arbres per a modelar aquestes hist ories evolutives
reticulars.
La principal motivaci o d'aquesta tesi es desenvolupar un nou model per a xarxes logen
etiques que modelen hist ories evolutives amb transfer encies laterals de gens, aix com
m etodes computacionals i algorismes per a la seva reconstrucci o.
El nou model que proposem, i que anomenem xarxes LGT, captura l'asimetria de les transfer
encies laterals de gens. El model es basa en considerar un arbre principal, representant
la l nia principal d'evoluci o de les esp ecies considerades, i un conjunt d'arcs modelant
les transfer encies laterals de gens. Les nostres xarxes LGT generalitzen altres models ja
existents que foren dissenyats amb un prop osit similar.
Resolem tamb e el problema ben conegut de reconstrucci o de xarxes logen etiques per a
les esmentades xarxes LGT a partir de conjunts indu ts d'arbres i de trinets. Ambd os
casos requereixen que s'hi imposin algunes restriccions topol ogiques per obtenir unicitat
de solucions, que es perd considerant xarxes LGT gen eriques.
Reconstru m aquestes xarxes a partir d'un conjunt d'arbres format per un arbre principal i
un conjunt d'arbres secundaris. Cadascun d'aquests ultims est a associat a un arc secundari
espec c. Per fer-ho, proposem un algorisme polin omic que apliquem a dades biol ogiques
reals per a predir o descobrir processos de transfer encia lateral de gens. Tamb e estudiem
el problema de reconstrucci o a partir d'un conjunt de xarxes LGT \b asiques" de nom es
tres fulles i un sol arc secundari. Anomenarem a aquestes xarxes, xarxes tri-lgt-nets que
serien similars a les conegudes trinets. Amb aix o, contribu m a estendre el conjunt de
xarxes logen etiques que poden ser reconstru des emprant les subestructures pr evies.
Finalment, estenem el marc del problema de reconciliaci o entre arbres de gens i arbres
d'esp ecies emprant les xarxes LGT com a log enia d'esp ecies. Per establir l'escenari evolutiu,
permetem les transfer encies laterals de gens, nom es a trav es dels arcs secundaris de
la xarxa, aix com tamb e duplicacions i p erdues. Per aix o, presentem algorismes computacionals
r apids adre cats a obtenir la reconciliaci o m es parsimoniosa entre un arbre de gens
i una xarxa LGT.
[spa] La logen etica es el estudio de las historias evolutivas y las relaciones entre especies, y
en particular de su reconstrucci on a partir de datos biol ogicos. Esta juega un papel importante
en la comprensi on de la biolog a puesto que permite establecer las relaciones de
parentesco entre organismos. Bajo la teor a de Darwin, que de ende la procedencia de
todas las especies de un ancestro com un, las historias evolutivas han sido representadas
usando arboles. No obstante, cuando ocurren procesos evolutivos no verticales c omo hibridaciones,
recombinaciones o transferencias laterales de genes, el uso de redes logen eticas
es, ciertamente, m as apropiado que el uso de arboles para modelar estas historias evolutivas
reticulares.
La principal motivaci on de esta tesis es desarrollar un nuevo modelo para redes logen eticas
que modelan historias evolutivas con transferencia lateral de genes, adem as de m etodos
computacionales y algoritmos para su reconstrucci on.
El nuevo modelo que proponemos, que llamamos redes LGT, captura la asimetr a de las
transferencias laterales de genes. El modelo se basa en considerar un arbol principal
representando la l nea principal de evoluci on de las especies consideradas y un conjunto
de arcos modelando las transferencias laterales de genes. Nuestras redes LGT generalizan
otros modelos ya existentes que fueron dise~nados con un prop osito similar.
Resolvemos el conocido problema de reconstrucci on de redes logen eticas para las mencionadas
redes LGT a partir de conjuntos inducidos de arboles y trinets. En ambos casos se
requiere la imposici on de restricciones topol ogicas para obtener unicidad en las soluciones,
ya que esta se pierde cuando consideramos redes LGT gen ericas.
Reconstruimos estas redes a partir de un conjunto de arboles formado por un arbol principal
y un conjunto de arboles secundarios. Cada uno de estos ultimos est a asociado a
un arco secundario espec co. Para hacerlo, proponemos un algoritmo polinomial que
aplicamos sobre datos biol ogicos reales para predecir o descubrir procesos de transferencia
lateral de genes. Tambi en estudiamos el problema de reconstrucci on a partir de un
conjunto de redes LGT \b asicas" de unicamente tres hojas y un s olo arco secundario.
Llamamos a estas ultimas redes tri-lgt-nets, similarares a las conocidas como trinets. Con
esto, contribuimos a extender el conjunto de posibles redes logen eticas que se pueden
reconstruir usando estas subestructuras.
Finalmente, extendemos el marco del problema de reconciliaci on entre arboles de genes
y arboles de especies usando las redes LGT c omo logenia de especies. Con el n de
establecer el escenario de evoluci on permitimos transferencias laterales de genes, s olo a
trav es de los arcos secundarios de la red, as como tambi en duplicaciones y p erdidas. Para
esto, presentamos algoritmos computacionales r apidos dirigidos a obtener la reconciliaci on
m as parsimoniosa entre un arbol de genes y una red LGT de especies.