New tools to protein interaction networks alignment and prediction

Show simple item record

dc.contributor.author Alcalá Mena, Adrià
dc.date 2022
dc.date.accessioned 2022-09-22T10:26:30Z
dc.date.available 2022-09-22T10:26:30Z
dc.date.issued 2022-09-22
dc.identifier.uri http://hdl.handle.net/11201/159730
dc.description.abstract [eng] All molecular functions and biological processes are carried out by groups of proteins that interact with each other. Proteins interactions are modeled by simple networks called protein-protein interaction networks (PPINs) whose nodes are proteins and whose edges are the protein-protein interactions. PPINs are broadly accepted to model the protein’s functional relations, and their analysis has become a key ingredient in the study of protein functions. Similar to the sequence alignment scenario, network alignment presents a comprehensive way to compare two or more biological networks. It considers not only biological interactions but also topological similarity of the neighborhood of biological nodes, and a most straightforward application of network alignment is to transfer known biological knowledge from well-studied species to unknown ones. With this purpose, several pairwise alignment algorithms have been proposed in the last years. Most PPINs aligners take into account both, the network topology and the biological features of the proteins, in the definition of “similarity.” However, this is a trade-off that is hard to achieve. In addition, most aligners are quite complicated and time-consuming to use in practice, and many researchers are faced with selecting an aligner without being able to compare its performance with other aligners. Motivated by this lack of well-balanced and efficient algorithms, we have designed AligNet, a parameter-free PPINs aligner capable to achieve a good balance between topological and biological matching. Besides AligNet, and motivated by the lack of a “one-size-fits all" PPINs aligner, we have developed PINAWeb, a user-friendly web-based tool that obtains and compares the results produced by 5 different aligners. Regarding the protein-protein interactions (PPIs) information, it must be obtained with high-throughput technology from metaproteomic data. Retrieving protein-protein interaction data experimentally is a very high time-consuming and labor-intensive task. Consequently, in the last years, the biological community has been looking for computational methods to correctly predict PPIs. The amount of new sequence data that is created every day, and its lack of a priori information, makes those methods that predict PPIs based on protein sequence information very popular. Under the requirement of predicting interactions based only on protein sequence information together with the idea to also exploit the PPIs information stored in the databases, we have designed Prots2Net, a PPIs predictor. To train the model, Prots2Net explores the PPIs retrieved from the STRING database of two selected species. The tests, reported on the Yeast and the Human datasets, show that Prots2Net performs better than the previous prediction methods. ca
dc.description.abstract [cat] Les proteïnes són les encarregades de dur a terme les funcions moleculars i els processos biològics de les cèl·lules, i per fer-ho, s’organitzen en grups que interactuen entre si. Aquestes interaccions es modelen amb grafs o xarxes anomenades xarxes d’interacció proteïna-proteïna (PPIN), on els nodes són les proteïnes i les arestes són les interaccions proteïna-proteïna (PPI). Les PPIN, s’han convertit en un model àmpliament acceptat per modelar les relacions funcionals de les proteïnes i la seva anàlisi és un ingredient clau en l’estudi de les seves funcions moleculars. De manera similar al cas de l’alineament de seqüències, l’alineament de xarxes proporciona un mètode de comparació de dues o més xarxes biològiques. Però en aquest cas, es consideren tant les funcions biològiques dels nodes alineats com la seva similitud topològica, per la qual cosa una aplicació directa de l’alineament d’aquestes xarxes és transferir coneixements biològics d’espècies ja estudiades a altres espècies noves. En els darrers vint anys han sorgit diversos algorismes d’alineament de PPIN. La majoria d’aquests alineadors es basen en la definició d’una "similitud" entre els nodes a alinear on es considera tant la topologia de la xarxa com les característiques biològiques de les proteïnes. Ara bé, obtenir un bon balanç entre similitud topològica i similitud biològica és una tasca molt difícil que encara no s’ha assolit, i que a més, alguns alineadors deixen en mans dels mateixos usuaris en forma de parámetres a escollir. Això, juntament amb l’esforç considerable per a la seva utilització que requereixen alguns alineadors, fa que molts d’investigadors es vegin abocats a seleccionar un alineador sense saber si és el més convenient i sobretot sense poder comparar-ne els resultats amb altres alineadors. Per tot això, en aquesta tesi hem dissenyat un nou alineador, AligNet, sense paràmetres a escollir per part de l’usuari i capaç d’aconseguir un bon equilibri entre la coincidència topològica de les xarxes a alinear i la biològica dels nodes alineats. A més, hem desenvolupat PINAWeb, una eina web que proporciona, compara i analitza els alineaments obtinguts pels cinc alineadors més ben considerats ara com ara. Finalment, pel que fa a les PPI, com que la seva obtenció de forma experimental és una tasca molt costosa, en els darrers anys s’ha optat pel disseny de mètodes computacionals que prediguin aquestes interaccions. Aquests predictors per ser d’utilitat, han de predir la interacció de les proteïnes en la mínima informació disponible d’aquestes, que normalment és la seqüència de les proteïnes. Sota el requisit de predir les interaccions a partir únicament de la informació de la seqüència de la proteïna juntament amb la idea d’explotar també la informació de les PPI disponible en les diferents bases de dades, hem dissenyat Prots2Net, un predictor de PPI. Aquest model de predicció utilitza les PPI de dues espècies conegudes obtingudes de la base de dades STRING i les seqüències de les proteïnes en el seu entrenament. Les proves duites a terme per avaluar Prots2Net que aquí es presenten, mostren que funciona millor que els mètodes de predicció coneguts ca
dc.description.abstract [spa] Las proteínas son las encargadas de llevar a cabo las funciones moleculares y los procesos biológicos de las células, y para hacerlo, se organizan en grupos que interactúan entre sí. Estas interacciones se modelan con grafos o redes llamadas redes de interacción proteína-proteína (PPIN), donde los nodos son las proteínas y las aristas son las interacciones proteína-proteína (PPI). Las PPIN, se han convertido en un modelo ampliamente aceptado para modelar las relaciones funcionales de las proteínas y su análisis es un ingrediente clave en el estudio de las funciones moleculares de las proteínas. De manera similar al caso del alineamiento de secuencias, el alineamiento de redes proporciona un método de comparación de dos o más redes biológicas. Pero en este caso, se consideran tanto las funciones biológicas como la similitud topológica de los nodos alineados, por lo que una aplicación directa del alineamiento de estas redes es transferir conocimientos biológicos de especies ya estudiadas a otras especies nuevas. En los últimos 20 años han surgido varios algoritmos de alineamiento de PPIN. La mayoría de estos alineadores se basan en la definición de una "similitud" entre los nodos a alinear, donde se considera tanto la topología de la red como las características biológicas de los nodos. Ahora bien, obtener un buen balance entre similitud topológica y similitud biológica es una tarea difícil que no se ha logrado todavía, y que incluso algunos alineadores dejan en manos de los mismos usuarios. Además, los alineadores requieren un esfuerzo considerable por parte del usuario para su utilización, por lo que muchos investigadores se ven obligados a seleccionar un alineador sin saber si es el más conveniente y sobre todo sin poder comparar los resultados con otros alineadores. Por este motivo, en esta tesis hemos diseñado un nuevo alineador, AligNet, sin parámetros a escoger por parte del usuario y que consigue un buen equilibrio entre la coincidencia topológica de las redes a alinear y la biológica de los nodos alineados. Además, hemos desarrollado PINAWeb, una herramienta web que proporciona, compara y analiza los alineamientos obtenidos por los cinco alineadores mejor considerados por ahora. En cuanto a las PPI, su obtención de forma experimental es una tarea muy costosa, y últimamente se opta por el diseño de métodos computacionales que predigan estas interacciones. Estos predictores, para ser útiles, deben predecir la interacción de las proteínas con la mínima información disponible de estas, que normalmente es la secuencia de las proteínas. Bajo el requisito de predecir las interacciones a partir únicamente de la información de la secuencia de la proteína, junto con la idea de explotar también la información de las PPI disponible en las diferentes bases de datos, en esta tesis hemos diseñado Prots2Net, un predictor de PPI. Este modelo de predicción utiliza, para su entrenamiento, las PPI de dos especies conocidas obtenidas de la base de datos STRING y las secuencias de las proteínas. Las pruebas realizadas, que aquí se presentan, muestran que Prots2Net obtiene mejores resultados que los métodos de predicción conocidos. ca
dc.format application/pdf
dc.format.extent 94 ca
dc.language.iso eng ca
dc.publisher Universitat de les Illes Balears
dc.rights all rights reserved
dc.rights info:eu-repo/semantics/openAccess
dc.subject.other Protein-protein interaction networks ca
dc.subject.other Global network alignment ca
dc.subject.other Protein-protein interaction prediction ca
dc.title New tools to protein interaction networks alignment and prediction ca
dc.type info:eu-repo/semantics/doctoralThesis
dc.type info:eu-repo/semantics/publishedVersion
dc.subject.udc 004 - Informàtica ca
dc.subject.udc 57 - Biologia ca
dc.subject.ac Biologia computacional i bioinformàtica ca
dc.contributor.director Llabrés Segura, Maria de la Mercè
dc.contributor.tutor Llabrés Segura, Maria de la Mercè
dc.doctorat Doctorat en Tecnologies de la Informació i les Comunicacions


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search Repository


Advanced Search

Browse

My Account

Statistics