Universidad Pública de Navarra



Año Académico: 2024/2025 | Otros años:  2023/2024 
Máster Universitario en Ingeniería Biomédica por la Universidad Pública de Navarra
Código: 720611 Asignatura: Bioinformática Avanzada
Créditos: 4.5 Tipo: Obligatoria Curso: 1 Periodo: 2º S
Departamento:
Profesorado:
RUIZ DE LOS MOZOS ALIAGA, IGOR (Resp)   [Tutorías ]

Partes de este texto:

 

Módulo/Materia

  • Módulo:
  • Materia: Bioinformática avanzada.

Subir

Descripción/Contenidos

Vivimos en una época de transformación sin precedentes en el ámbito de la genómica, lo que ha propiciado avances significativos en nuestra comprensión de la biología, la medicina de precisión y la investigación de enfermedades a nivel molecular. La reducción de los costos de secuenciación masiva (NGS) y el desarrollo de la biología computacional han sido pilares fundamentales en este progreso, permitiendo el análisis de grandes conjuntos de datos genómicos de manera eficiente y precisa. En respuesta a esta creciente demanda, este curso se enfoca en proporcionar los conocimientos esenciales para el procesamiento y análisis de datos de secuenciación masiva (NGS) y tecnologías Ómicas, adoptando un enfoque práctico y aplicado.
Comenzaremos explorando la evolución y los principios básicos de las tecnologías de secuenciación, así como sus diversas aplicaciones en la investigación biomédica. Además, realizaremos visitas a instalaciones de secuenciación de última generación y laboratorios de preparación de muestras, incluyendo el Centro de Secuenciación y el clúster Urederra en NASERTIC, que es uno de los nodos líderes en secuenciación y supercomputación (HPC) en Navarra.
Una vez entendido el funcionamiento técnico de la secuenciación, iniciaremos el aprendizaje del lenguaje UNIX, utilizado para acceder a grandes clústeres de computación y para el uso y creación de algoritmos de análisis de NGS. Continuaremos usando lecturas sintéticas de secuenciación para llevar a cabo todo el proceso de análisis hasta la  comparación genómica del brote epidémico de E. coli de 2011, con el objetivo de descubrir sus mecanismos de virulencia y resistencia antibiótica. Esta tecnología es puntera y actualmente se utiliza en la lucha contra la pandemia de COVID-19. Aplicaremos estos conceptos al análisis de expresión diferencial de genes, así como a los últimos avances en cuantificación y variación a nivel de transcrito. Finalmente, culminaremos con pautas sobre la nueva medicina de precisión orientada al paciente y tratamientos personalizados, equipando a los estudiantes con el conocimiento necesario para avanzar en esta área vanguardista.
La mayor parte de la computación práctica en este curso se realizará en un entorno de nube simulado, que emula un entorno HPC, donde todas las necesidades computacionales serán atendidas mediante el uso de entornos Docker y Conda. Durante el curso, también adquiriremos habilidades esenciales en el manejo del entorno UNIX, utilizando comandos de una sola línea (one-liners) para manipular y procesar datos de manera rápida y efectiva. Exploraremos el uso de entornos de gestión de paquetes como Conda y Mamba para configurar y mantener nuestras herramientas y librerías bioinformáticas. Nos familiarizaremos con la creación, configuración y despliegue de contenedores Docker, lo que nos permitirá construir ambientes de desarrollo reproducibles y portátiles. Asimismo, aprenderemos a manejar puertos y a generar salidas en formatos como HTML, facilitando la presentación y visualización de nuestros resultados. Además, aprovecharemos herramientas de inteligencia artificial como ChatGPT y GitHub Copilot para mejorar el aprendizaje y la creación de código asociado a la biología computacional.
Todo este conjunto de habilidades estará orientado a abordar grandes interrogantes biológicas mediante el análisis de datos masivos genómicos y transcriptómicos. Nos sumergiremos en el análisis de expresión génica diferencial y exploraremos los últimos avances en la cuantificación y variación de transcritos. Concluiremos el curso adquiriendo habilidades en lenguajes de flujo de trabajo bioinformático como Snakemake y Nextflow, fundamentales para la creación de pipelines y workflows en entornos HPC. Al finalizar este módulo, los alumnos estarán capacitados para diseñar y analizar modernas tecnologías Ómicas, trabajar eficientemente en entornos HPC-UNIX y preparar algoritmos para llevar a cabo todos los procesos necesarios en el análisis de datos genómicos. Esto les permitirá contribuir significativamente en la investigación biomédica y la medicina de precisión, generando conocimiento y respuestas a importantes preguntas en el campo de la biología molecular.

Subir

Competencias genéricas

  • CB1. Que los estudiantes hayan demostrado poseer y comprender conocimientos en un área de estudio que parte de la base de la educación secundaria general, y se suele encontrar a un nivel que, si bien se apoya en libros de texto avanzados, incluye también algunos aspectos que implican conocimientos procedentes de la vanguardia de su campo de estudio.
  • CB3 - Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio) para emitir juicios que incluyan una reflexión sobre temas relevantes de índole social, científica o ética 
  • CB5 - Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía 
  • CG1 - Planificar y organizar el tiempo y gestionar la propia formación continua, actualizando el conocimiento de las innovaciones del ámbito científico y saber analizar las tendencias de futuro. 
  • CG2 - Pensar de forma integrada y abordar los problemas desde diferentes perspectivas. Tener razonamiento crítico. Aportar soluciones a problemas en el ámbito científico. 
  • CG3 - Trabajar en equipo, seleccionar y elegir la metodología de trabajo y distribución de funciones. Saber escuchar y hacer uso de la palabra con intervenciones positivas y constructivas. 

Subir

Competencias específicas

  • CG1. Aplicar la capacidad analítica y de abstracción, la intuición y el pensamiento lógico adquiridos para identificar y analizar problemas complejos y buscar y formular soluciones en un entorno multidisciplinar.
  • CG5. Capacidad para la aplicación de los conocimientos adquiridos y de resolver problemas en entornos nuevos o poco conocidos en el ámbito de la Bioinformática.
  • CE1 - Plantear y resolver problemas cualitativos y cuantitativos en biología a través de hipótesis científicas que puedan examinarse empíricamente y que se basen en los conocimientos y teorías disponibles. 
  • CE4 - Utilizar las matemáticas, la estadística y la informática para obtener, analizar e interpretar datos y para elaborar modelos de los sistemas y procesos biológicos. 
  • CE6 - Actualizar autónoma y permanentemente los conocimientos e integrar los nuevos descubrimientos en su contexto adecuado. 
  • CE14. Explotar la información de las bases de datos biológicas sobre secuencias, estructuras, transcriptomas, genomas, proteomas, etc.

Subir

Resultados aprendizaje

  • Conocer y comprender la problemática del estudio de similitud biológica de moléculas y de sus variaciones
  • Conocer y comprender  las técnicas bioinformáticas aplicadas al estudio de similitud biológica de moléculas y de sus variaciones
  • Conocer y comprender la necesidad de integración de información masiva en un sistema biológico complejo
  • Conocer y aplicar las técnicas y herramientas bioinformáticas para el análisis de expresión génica
  • Entender las posibilidades y limitaciones de las metodologías y herramientas relacionadas con secuenciación de nueva generación y/o OMICs
  • Conocer las herramientas y técnicas para el análisis y anotación de genomas o exomas
  • Seleccionar las técnicas y herramientas para el análisis y anotación de genomas o exomas más adecuadas para un problema dado
  • Conocer las técnicas y herramientas más empleadas en metagenómica
  • Aprender a interpretar los resultados de las herramientas de ayuda para la secuenciación, el análisis de genomas y metagenómica
  • Conocer las particularidades de las técnicas de secuenciación y estructuras genómicas y la resolución de problemas desde la bioinformática

Subir

Metodología

Metodología - Actividad Horas Presenciales Horas no presenciales
A-1 Clases expositivas/participativas 24 0
A-2 Prácticas 15 0
A-3 Realización de trabajos/proyectos 0 17,5
A-4 Lecturas de material 0 10
A-5 Estudio y trabajo autónomo del estudiante 0 40
A-6 Tutorías 3 0
A-7 Pruebas de evaluación 3 0
Total 45  67,5

Subir

Evaluación

 

Resultados de
aprendizaje
Actividad de
evaluación
Peso (%) Carácter
recuperable
Nota mínima
requerida
RA1-RA7 Pruebas escritas: Examen teórico-práctico en periodo de evaluación 50 5
RA1-RA7 Trabajos e informes: Prácticas entregadas a lo largo del semestre 45 No -
RA1-RA7 Participación activa: Registro activo del profesor durante el semestre 5 No -
         
         

Si en alguna de las actividades no se cumpliera el mínimo para ponderar, la nota de la asignatura será como máximo 4,9 sobre 10 (suspenso).

 

Subir

Temario

Temario Teórico - Práctico

Tema 1: Teoría de la secuenciación

  • Evolución de las plataformas de secuenciación
  • Desde las muestras hasta las librerías de secuenciación
  • Desde la librería hasta las lecturas (reads) 
  • Estructura de los NGS (next-generation sequencing), control de calidad del preprocesado 
  • Visión general de los flujos de trabajo bioinformáticos 

Tema 2: Secuenciación práctica

  • Visita al centro de secuenciación masiva de Nasertic
  • Secuenciación del exoma y genoma completo (Whole Exome/Genome)
  • Experimentos RNA-Seq
  • Secuenciación Single-cell
  • Spatial Transcriptomics

Tema 3: Otras tecnologías Ómicas

  • Introducción al estudio de la proteómica, metabolómica, epigenética, epigenómica y microbioma
  • Técnicas de separación de proteínas (ej. electroforesis en gel bidimensional)
  • Análisis de interacción proteína-proteína
  • Análisis de datos metabolómicos
  • Análisis de datos epigenómicos y epitranscriptómicos
  • Estudio de patrones de metilación del ADN y modificaciones de histonas
  • Aplicaciones de la epigenómica en la investigación de enfermedades
  • Análisis de la diversidad microbiana y funciones metabólicas
  • Integración de datos ómicos (multi-omics)
  • Métodos bioinformáticos para la integración de datos transcriptómicos, proteómicos y metabolómicos
  • Análisis de redes biológicas

Tema 4: Unix y clústeres de alto rendimiento

  • Visita al centro de Super Computación Urederra de Nasertic
  • Acceso a recursos computacionales en la nube emulando a un HPC
  • Curso intensivo de UNIX/bash
  • Curso intensivo en Ordenadores de Alto Rendimiento (High-Performance Computers)

Tema 5: Alineamiento NGS con computación avanzada

  • Evaluación de calidad de datos de secuenciación
  • Limpieza, descontaminación y demultiplex
  • Teoría del alineamiento NGS, desde datos crudos multiplexados a lecturas alineadas. 
  • Mejorar los parámetros de alineamiento y estado del arte de los análisis NGS. 
  • Alineamiento contra referencia y de novo

Tema 6: Detección de diferencias NGS (variant calling) y secuenciación genómica

  • Traducción de las lecturas de secuenciación para obtener el genoma completo de interés
  • Identificar mutaciones de nucleótidos puntuales que pueden convertirse en diferencias fenotípicas o virulentas

Tema 7: Comparación computacional del genoma

  • Desde la secuencia consenso del DNA hasta la exploración genómica para inferir ganancia o pérdida de funciones.
  • Especialización genómica y la evolución genómica. 
  • Análisis genómico en un caso de pandemia.
  • Diseño y selección de antibióticos susceptibles
  • Evaluación de mecanismo de virulencia microbiológica

Tema 8: Análisis de RNA-seq

  • Tecnologías transcriptómicas de secuenciación 
  • Cuantificación de la expresión génica
  • Clusterización y caracterización de muestras, hierarchical y k-means
  • Reducción de dimensiones PCA
  • Análisis de expresión diferencial: teoría y practica
  • Integración y anotación de datos
  • Análisis funcional: Gene Set Enrichment Analysis
  • Corrección de desviación por lotes
  • Cuantificación a nivel de transcrito, nuevos algoritmos sin mapeo genómico
  • Predicción de efectos sobre el trascriptoma

Tema 9: Computación de alto rendimiento con workflows en Snakemake

  • Iniciación a lenguaje de workflows en Snakemake.
  • Análisis NGS en Snakemake.
  • Análisis de reproducibilidad, trazabilidad y aprovechamiento de recursos en entornos HPC.
  • Descripción de Nextflow y nf-core para la creación de pipelines bioinformáticas

Tema 10: Aplicación de técnicas de Inteligencia Artificial para la creación de Código Bioinformático

  • Iniciación IA para creación de código computacional
  • Prompt engineering en bioinformática
  • Auto digestión y auto-comprension de datos biológicos ayudado por AI
  • Programación en Bash, Python y R guiada por AI

Tema 11: Documentación, trazabilidad y estabilidad del código bioinformático en GitHub

  • Fundamentos de Git y GitHub para la gestión de código
  • Creación y mantenimiento de repositorios
  • Documentación efectiva del código y proyectos
  • Estrategias para asegurar la trazabilidad del desarrollo del software
  • Mantenimiento de la estabilidad del código mediante control de versiones
  • Uso de GitHub Actions para automatización y CI/CD (Integración Continua/Despliegue Continuo)
  • Mejores prácticas para la colaboración en proyectos bioinformáticos mediante GitHub

 

 

Subir

Programa de prácticas experimentales

Temario Práctico

Las clases se dividirán en sesiones teórico-prácticas, donde se abordarán los conceptos teóricos fundamentales y su aplicación en contextos reales. A lo largo de las sesiones, los estudiantes no solo aprenderán los principios teóricos clave, sino que también tendrán la oportunidad de aplicar estos conocimientos en ejercicios computacionales prácticos y relevantes para cada temática. Este enfoque permitirá una comprensión más profunda de los temas tratados, facilitando la adquisición de habilidades técnicas esenciales. Además, los estudiantes utilizarán herramientas y software especializado para resolver problemas y analizar datos, lo que fomentará un aprendizaje interactivo y orientado a la práctica, preparando a los alumnos para enfrentarse a desafíos reales en el ámbito de la bioinformática.

 

 

Subir

Bibliografía

Acceda a la bibliografía que el profesorado de la asignatura ha solicitado a la Biblioteca.


No existe un texto que cubra todos los aspectos tratados en la asignatura, sin embargo puede ser útil la consulta para diferentes aspectos de:

Understanding Bioinformatics: Genes to Proteins. Springer International Publishing, 2019. [Recurso electrónico].

Choudhuri, S. Bioinformatics for beginners: genes, genomes, molecular evolution, databases and analytical tools. Academic Press, 2014. [Recurso electrónico].

Lesk, AM. Introduction to bioinformatics. Oxford University Press, 2014. [Signatura Biblioteca: CIB 002.237].

Edwards, D; Stajich, J; Hansen, D. Bioinformatics: Tools and Applications. Springer New York, 2009. [Recurso electrónico].

Sharma, TR. Genome analysis and bioinformatics: a practical approach. I. K. International, 2009. [Signatura Biblioteca: GEN.(2) 001.555].

Zvelebil, MJ; Baum, JO. Understanding bioinformatics. Garland Science, 2008. [Signatura Biblioteca: BIO 002.444].

Barnes, MR. Bioinformatics for geneticists: a bioinformatics primer for the analysis of genetic data. Wiley, 2007. [Signatura Biblioteca: GEN.(2) 001.533].

Claverie, J-M; Notredame, C. Bioinformatics for dummies. Wiley, 2007. [Signatura Biblioteca: BIO 002.435].

Krane, DE; Raymer, ML. Fundamental concepts of bioinformatics. Benjamin Cummings, 2003. [Signatura Biblioteca CIB. 002.246].

Mount, DW. Bioinformatics: sequence and genome analysis. Cold Spring Harbor Laboratory Press, 2001. [Signatura Biblioteca: GEN.(2) 001.471]

Ouellette, BFF; Baxevanis, AD. Bioinformatics: a practical guide to analysis of genes and proteins. John Wiley & Sons, 1998. [Signatura Biblioteca: BIOQUI.(2) 001.752]

 

Subir

Idiomas

Castellano

Subir

Lugar de impartición

Aulario, UPNA

Subir