dc.contributor.author |
Alcalá Mena, Adrià |
|
dc.date |
2022 |
|
dc.date.accessioned |
2022-09-22T10:26:30Z |
|
dc.date.available |
2022-09-22T10:26:30Z |
|
dc.date.issued |
2022-09-22 |
|
dc.identifier.uri |
http://hdl.handle.net/11201/159730 |
|
dc.description.abstract |
[eng] All molecular functions and biological processes are carried out by groups of proteins
that interact with each other. Proteins interactions are modeled by simple networks called
protein-protein interaction networks (PPINs) whose nodes are proteins and whose edges
are the protein-protein interactions. PPINs are broadly accepted to model the protein’s
functional relations, and their analysis has become a key ingredient in the study of protein
functions.
Similar to the sequence alignment scenario, network alignment presents a comprehensive
way to compare two or more biological networks. It considers not only biological
interactions but also topological similarity of the neighborhood of biological nodes,
and a most straightforward application of network alignment is to transfer known biological
knowledge from well-studied species to unknown ones. With this purpose, several
pairwise alignment algorithms have been proposed in the last years. Most PPINs aligners
take into account both, the network topology and the biological features of the proteins,
in the definition of “similarity.” However, this is a trade-off that is hard to achieve. In
addition, most aligners are quite complicated and time-consuming to use in practice, and
many researchers are faced with selecting an aligner without being able to compare its
performance with other aligners. Motivated by this lack of well-balanced and efficient
algorithms, we have designed AligNet, a parameter-free PPINs aligner capable to achieve
a good balance between topological and biological matching. Besides AligNet, and motivated
by the lack of a “one-size-fits all" PPINs aligner, we have developed PINAWeb, a
user-friendly web-based tool that obtains and compares the results produced by 5 different
aligners.
Regarding the protein-protein interactions (PPIs) information, it must be obtained
with high-throughput technology from metaproteomic data. Retrieving protein-protein
interaction data experimentally is a very high time-consuming and labor-intensive task.
Consequently, in the last years, the biological community has been looking for computational
methods to correctly predict PPIs. The amount of new sequence data that is created
every day, and its lack of a priori information, makes those methods that predict PPIs
based on protein sequence information very popular. Under the requirement of predicting
interactions based only on protein sequence information together with the idea to also
exploit the PPIs information stored in the databases, we have designed Prots2Net, a PPIs
predictor. To train the model, Prots2Net explores the PPIs retrieved from the STRING
database of two selected species. The tests, reported on the Yeast and the Human datasets,
show that Prots2Net performs better than the previous prediction methods. |
ca |
dc.description.abstract |
[cat] Les proteïnes són les encarregades de dur a terme les funcions moleculars i els processos
biològics de les cèl·lules, i per fer-ho, s’organitzen en grups que interactuen entre si.
Aquestes interaccions es modelen amb grafs o xarxes anomenades xarxes d’interacció
proteïna-proteïna (PPIN), on els nodes són les proteïnes i les arestes són les interaccions
proteïna-proteïna (PPI). Les PPIN, s’han convertit en un model àmpliament acceptat per
modelar les relacions funcionals de les proteïnes i la seva anàlisi és un ingredient clau en
l’estudi de les seves funcions moleculars.
De manera similar al cas de l’alineament de seqüències, l’alineament de xarxes proporciona
un mètode de comparació de dues o més xarxes biològiques. Però en aquest
cas, es consideren tant les funcions biològiques dels nodes alineats com la seva similitud
topològica, per la qual cosa una aplicació directa de l’alineament d’aquestes xarxes és
transferir coneixements biològics d’espècies ja estudiades a altres espècies noves. En
els darrers vint anys han sorgit diversos algorismes d’alineament de PPIN. La majoria
d’aquests alineadors es basen en la definició d’una "similitud" entre els nodes a alinear
on es considera tant la topologia de la xarxa com les característiques biològiques de les
proteïnes. Ara bé, obtenir un bon balanç entre similitud topològica i similitud biològica
és una tasca molt difícil que encara no s’ha assolit, i que a més, alguns alineadors deixen
en mans dels mateixos usuaris en forma de parámetres a escollir. Això, juntament amb
l’esforç considerable per a la seva utilització que requereixen alguns alineadors, fa que
molts d’investigadors es vegin abocats a seleccionar un alineador sense saber si és el més
convenient i sobretot sense poder comparar-ne els resultats amb altres alineadors. Per tot
això, en aquesta tesi hem dissenyat un nou alineador, AligNet, sense paràmetres a escollir
per part de l’usuari i capaç d’aconseguir un bon equilibri entre la coincidència topològica
de les xarxes a alinear i la biològica dels nodes alineats. A més, hem desenvolupat
PINAWeb, una eina web que proporciona, compara i analitza els alineaments obtinguts
pels cinc alineadors més ben considerats ara com ara.
Finalment, pel que fa a les PPI, com que la seva obtenció de forma experimental és
una tasca molt costosa, en els darrers anys s’ha optat pel disseny de mètodes computacionals
que prediguin aquestes interaccions. Aquests predictors per ser d’utilitat, han de
predir la interacció de les proteïnes en la mínima informació disponible d’aquestes, que
normalment és la seqüència de les proteïnes. Sota el requisit de predir les interaccions a
partir únicament de la informació de la seqüència de la proteïna juntament amb la idea
d’explotar també la informació de les PPI disponible en les diferents bases de dades, hem
dissenyat Prots2Net, un predictor de PPI. Aquest model de predicció utilitza les PPI de
dues espècies conegudes obtingudes de la base de dades STRING i les seqüències de les
proteïnes en el seu entrenament. Les proves duites a terme per avaluar Prots2Net que
aquí es presenten, mostren que funciona millor que els mètodes de predicció coneguts |
ca |
dc.description.abstract |
[spa] Las proteínas son las encargadas de llevar a cabo las funciones moleculares y los procesos
biológicos de las células, y para hacerlo, se organizan en grupos que interactúan
entre sí. Estas interacciones se modelan con grafos o redes llamadas redes de interacción
proteína-proteína (PPIN), donde los nodos son las proteínas y las aristas son las
interacciones proteína-proteína (PPI). Las PPIN, se han convertido en un modelo ampliamente
aceptado para modelar las relaciones funcionales de las proteínas y su análisis es
un ingrediente clave en el estudio de las funciones moleculares de las proteínas.
De manera similar al caso del alineamiento de secuencias, el alineamiento de redes
proporciona un método de comparación de dos o más redes biológicas. Pero en este caso,
se consideran tanto las funciones biológicas como la similitud topológica de los nodos
alineados, por lo que una aplicación directa del alineamiento de estas redes es transferir
conocimientos biológicos de especies ya estudiadas a otras especies nuevas. En los últimos
20 años han surgido varios algoritmos de alineamiento de PPIN. La mayoría de estos
alineadores se basan en la definición de una "similitud" entre los nodos a alinear, donde
se considera tanto la topología de la red como las características biológicas de los nodos.
Ahora bien, obtener un buen balance entre similitud topológica y similitud biológica es
una tarea difícil que no se ha logrado todavía, y que incluso algunos alineadores dejan en
manos de los mismos usuarios. Además, los alineadores requieren un esfuerzo considerable
por parte del usuario para su utilización, por lo que muchos investigadores se ven
obligados a seleccionar un alineador sin saber si es el más conveniente y sobre todo sin
poder comparar los resultados con otros alineadores. Por este motivo, en esta tesis hemos
diseñado un nuevo alineador, AligNet, sin parámetros a escoger por parte del usuario y
que consigue un buen equilibrio entre la coincidencia topológica de las redes a alinear
y la biológica de los nodos alineados. Además, hemos desarrollado PINAWeb, una herramienta
web que proporciona, compara y analiza los alineamientos obtenidos por los
cinco alineadores mejor considerados por ahora.
En cuanto a las PPI, su obtención de forma experimental es una tarea muy costosa,
y últimamente se opta por el diseño de métodos computacionales que predigan estas
interacciones. Estos predictores, para ser útiles, deben predecir la interacción de las proteínas
con la mínima información disponible de estas, que normalmente es la secuencia
de las proteínas. Bajo el requisito de predecir las interacciones a partir únicamente de
la información de la secuencia de la proteína, junto con la idea de explotar también la
información de las PPI disponible en las diferentes bases de datos, en esta tesis hemos
diseñado Prots2Net, un predictor de PPI. Este modelo de predicción utiliza, para su entrenamiento,
las PPI de dos especies conocidas obtenidas de la base de datos STRING y
las secuencias de las proteínas. Las pruebas realizadas, que aquí se presentan, muestran
que Prots2Net obtiene mejores resultados que los métodos de predicción conocidos. |
ca |
dc.format |
application/pdf |
|
dc.format.extent |
94 |
ca |
dc.language.iso |
eng |
ca |
dc.publisher |
Universitat de les Illes Balears |
|
dc.rights |
all rights reserved |
|
dc.rights |
info:eu-repo/semantics/openAccess |
|
dc.subject.other |
Protein-protein interaction networks |
ca |
dc.subject.other |
Global network alignment |
ca |
dc.subject.other |
Protein-protein interaction prediction |
ca |
dc.title |
New tools to protein interaction networks alignment and prediction |
ca |
dc.type |
info:eu-repo/semantics/doctoralThesis |
|
dc.type |
info:eu-repo/semantics/publishedVersion |
|
dc.subject.udc |
004 - Informàtica |
ca |
dc.subject.udc |
57 - Biologia |
ca |
dc.subject.ac |
Biologia computacional i bioinformàtica |
ca |
dc.contributor.director |
Llabrés Segura, Maria de la Mercè |
|
dc.contributor.tutor |
Llabrés Segura, Maria de la Mercè |
|
dc.doctorat |
Doctorat en Tecnologies de la Informació i les Comunicacions |
|