Estudio a nivel masivo del proteoma compartido por las especies del género Bifidobacterium

Vaquero Rey, Aida

Autor/es: Vaquero Rey, Aida

Director/es: Benítez Páez, Alfonso

Palabra/s clave: Bifidobacterium; Proteoma central; Proteoma extendido; Familias CAZy

Titulación: Máster Universitario en Bioinformática

Fecha de defensa: 2023-11

Tipo de contenido: TFM

URI: https://hdl.handle.net/20.500.12880/7519

Resumen:

El género Bifidobacterium es uno de los más predominantes en el tracto gastrointestinal humano (TGI), relacionado con el metabolismo de los carbohidratos derivados del hospedador y de la dieta. Se sabe que las especies de Bifidobacterium más predominantes en TGI son las más adaptadas a este nicho, sin embargo, se desconocen los mecanismos moleculares. Objetivos: El objetivo general del presente trabajo fue realizar un análisis masivo de genomas completos de Bifidobacterium con hospedador humano, identificando los genes codificantes para estudiar las funciones proteicas compartidas en el total de genomas. Material y métodos: Se partió de un total de 822 genomas completos recogidos de la base de datos BV-BRC del género Bifidobacterium. Se llevaron a cabo distintos filtros para obtener únicamente genomas no contaminados y pertenecientes al género Bifidobacterium con hospedador humano. Se llevaron a cabo predicciones de genes codificantes, agrupamientos múltiples y alineamientos múltiples de secuencias con el fin de realizar una anotación funcional a través de agrupamientos de genes ortólogos (COG). Para todo ello, se utilizó el software R y distintas herramientas instaladas en una máquina virtual con sistema operativo Linux, distribución Ubuntu. Resultados: B.longum fue la especie más representada en el conjunto de estudio. Por otra parte, el análisis de la calidad de los genomas reveló 15 genomas contaminados, que se eliminaron para los posteriores análisis. De los agrupamientos múltiples, el realizado con un 85% de identidad de secuencia fue el que mejor representó el proteoma central. Con este umbral, la categoría J (traducción, estructura y biogénesis ribosómica) fue la más representada. Por último, se identificaron 7 familias distintas relacionadas con el metabolismo de los carbohidratos (CAZy) utilizando un umbral de agrupamiento del 50% de identidad, representando el proteoma extendido. Conclusiones: Los genomas analizados presentaron una alta calidad que sostiene los resultados obtenidos. Por otro lado, el establecimiento del proteoma central y la detección de las familias CAZy permitirán futuros estudios de divergencia funcional relacionada con el metabolismo de carbohidratos