Código: 720611 | Asignatura: Bioinformática Avanzada | ||||
Créditos: 4.5 | Tipo: Obligatoria | Curso: 1 | Periodo: 2º S | ||
Departamento: | |||||
Profesorado: | |||||
RUIZ DE LOS MOZOS ALIAGA, IGOR (Resp) [Tutorías ] |
Vivimos en una época de transformación sin precedentes en el ámbito de la genómica, lo que ha propiciado avances significativos en nuestra comprensión de la biología, la medicina de precisión y la investigación de enfermedades a nivel molecular. La reducción de los costos de secuenciación masiva (NGS) y el desarrollo de la biología computacional han sido pilares fundamentales en este progreso, permitiendo el análisis de grandes conjuntos de datos genómicos de manera eficiente y precisa. En respuesta a esta creciente demanda, este curso se enfoca en proporcionar los conocimientos esenciales para el procesamiento y análisis de datos de secuenciación masiva (NGS) y tecnologías Ómicas, adoptando un enfoque práctico y aplicado.
Comenzaremos explorando la evolución y los principios básicos de las tecnologías de secuenciación, así como sus diversas aplicaciones en la investigación biomédica. Además, realizaremos visitas a instalaciones de secuenciación de última generación y laboratorios de preparación de muestras, incluyendo el Centro de Secuenciación y el clúster Urederra en NASERTIC, que es uno de los nodos líderes en secuenciación y supercomputación (HPC) en Navarra.
Una vez entendido el funcionamiento técnico de la secuenciación, iniciaremos el aprendizaje del lenguaje UNIX, utilizado para acceder a grandes clústeres de computación y para el uso y creación de algoritmos de análisis de NGS. Continuaremos usando lecturas sintéticas de secuenciación para llevar a cabo todo el proceso de análisis hasta la comparación genómica del brote epidémico de E. coli de 2011, con el objetivo de descubrir sus mecanismos de virulencia y resistencia antibiótica. Esta tecnología es puntera y actualmente se utiliza en la lucha contra la pandemia de COVID-19. Aplicaremos estos conceptos al análisis de expresión diferencial de genes, así como a los últimos avances en cuantificación y variación a nivel de transcrito. Finalmente, culminaremos con pautas sobre la nueva medicina de precisión orientada al paciente y tratamientos personalizados, equipando a los estudiantes con el conocimiento necesario para avanzar en esta área vanguardista.
La mayor parte de la computación práctica en este curso se realizará en un entorno de nube simulado, que emula un entorno HPC, donde todas las necesidades computacionales serán atendidas mediante el uso de entornos Docker y Conda. Durante el curso, también adquiriremos habilidades esenciales en el manejo del entorno UNIX, utilizando comandos de una sola línea (one-liners) para manipular y procesar datos de manera rápida y efectiva. Exploraremos el uso de entornos de gestión de paquetes como Conda y Mamba para configurar y mantener nuestras herramientas y librerías bioinformáticas. Nos familiarizaremos con la creación, configuración y despliegue de contenedores Docker, lo que nos permitirá construir ambientes de desarrollo reproducibles y portátiles. Asimismo, aprenderemos a manejar puertos y a generar salidas en formatos como HTML, facilitando la presentación y visualización de nuestros resultados. Además, aprovecharemos herramientas de inteligencia artificial como ChatGPT y GitHub Copilot para mejorar el aprendizaje y la creación de código asociado a la biología computacional.
Todo este conjunto de habilidades estará orientado a abordar grandes interrogantes biológicas mediante el análisis de datos masivos genómicos y transcriptómicos. Nos sumergiremos en el análisis de expresión génica diferencial y exploraremos los últimos avances en la cuantificación y variación de transcritos. Concluiremos el curso adquiriendo habilidades en lenguajes de flujo de trabajo bioinformático como Snakemake y Nextflow, fundamentales para la creación de pipelines y workflows en entornos HPC. Al finalizar este módulo, los alumnos estarán capacitados para diseñar y analizar modernas tecnologías Ómicas, trabajar eficientemente en entornos HPC-UNIX y preparar algoritmos para llevar a cabo todos los procesos necesarios en el análisis de datos genómicos. Esto les permitirá contribuir significativamente en la investigación biomédica y la medicina de precisión, generando conocimiento y respuestas a importantes preguntas en el campo de la biología molecular.
Metodología - Actividad | Horas Presenciales | Horas no presenciales |
A-1 Clases expositivas/participativas | 24 | 0 |
A-2 Prácticas | 15 | 0 |
A-3 Realización de trabajos/proyectos | 0 | 17,5 |
A-4 Lecturas de material | 0 | 10 |
A-5 Estudio y trabajo autónomo del estudiante | 0 | 40 |
A-6 Tutorías | 3 | 0 |
A-7 Pruebas de evaluación | 3 | 0 |
Total | 45 | 67,5 |
Resultados de aprendizaje |
Actividad de evaluación |
Peso (%) | Carácter recuperable |
Nota mínima requerida |
---|---|---|---|---|
RA1-RA7 | Pruebas escritas: Examen teórico-práctico en periodo de evaluación | 50 | Sí | 5 |
RA1-RA7 | Trabajos e informes: Prácticas entregadas a lo largo del semestre | 45 | No | - |
RA1-RA7 | Participación activa: Registro activo del profesor durante el semestre | 5 | No | - |
Si en alguna de las actividades no se cumpliera el mínimo para ponderar, la nota de la asignatura será como máximo 4,9 sobre 10 (suspenso).
Temario Teórico - Práctico
Tema 1: Teoría de la secuenciación
Tema 2: Secuenciación práctica
Tema 3: Otras tecnologías Ómicas
Tema 4: Unix y clústeres de alto rendimiento
Tema 5: Alineamiento NGS con computación avanzada
Tema 6: Detección de diferencias NGS (variant calling) y secuenciación genómica
Tema 7: Comparación computacional del genoma
Tema 8: Análisis de RNA-seq
Tema 9: Computación de alto rendimiento con workflows en Snakemake
Tema 10: Aplicación de técnicas de Inteligencia Artificial para la creación de Código Bioinformático
Tema 11: Documentación, trazabilidad y estabilidad del código bioinformático en GitHub
Temario Práctico
Las clases se dividirán en sesiones teórico-prácticas, donde se abordarán los conceptos teóricos fundamentales y su aplicación en contextos reales. A lo largo de las sesiones, los estudiantes no solo aprenderán los principios teóricos clave, sino que también tendrán la oportunidad de aplicar estos conocimientos en ejercicios computacionales prácticos y relevantes para cada temática. Este enfoque permitirá una comprensión más profunda de los temas tratados, facilitando la adquisición de habilidades técnicas esenciales. Además, los estudiantes utilizarán herramientas y software especializado para resolver problemas y analizar datos, lo que fomentará un aprendizaje interactivo y orientado a la práctica, preparando a los alumnos para enfrentarse a desafíos reales en el ámbito de la bioinformática.
Acceda a la bibliografía que el profesorado de la asignatura ha solicitado a la Biblioteca.
No existe un texto que cubra todos los aspectos tratados en la asignatura, sin embargo puede ser útil la consulta para diferentes aspectos de:
Understanding Bioinformatics: Genes to Proteins. Springer International Publishing, 2019. [Recurso electrónico].
Choudhuri, S. Bioinformatics for beginners: genes, genomes, molecular evolution, databases and analytical tools. Academic Press, 2014. [Recurso electrónico].
Lesk, AM. Introduction to bioinformatics. Oxford University Press, 2014. [Signatura Biblioteca: CIB 002.237].
Edwards, D; Stajich, J; Hansen, D. Bioinformatics: Tools and Applications. Springer New York, 2009. [Recurso electrónico].
Sharma, TR. Genome analysis and bioinformatics: a practical approach. I. K. International, 2009. [Signatura Biblioteca: GEN.(2) 001.555].
Zvelebil, MJ; Baum, JO. Understanding bioinformatics. Garland Science, 2008. [Signatura Biblioteca: BIO 002.444].
Barnes, MR. Bioinformatics for geneticists: a bioinformatics primer for the analysis of genetic data. Wiley, 2007. [Signatura Biblioteca: GEN.(2) 001.533].
Claverie, J-M; Notredame, C. Bioinformatics for dummies. Wiley, 2007. [Signatura Biblioteca: BIO 002.435].
Krane, DE; Raymer, ML. Fundamental concepts of bioinformatics. Benjamin Cummings, 2003. [Signatura Biblioteca CIB. 002.246].
Mount, DW. Bioinformatics: sequence and genome analysis. Cold Spring Harbor Laboratory Press, 2001. [Signatura Biblioteca: GEN.(2) 001.471]
Ouellette, BFF; Baxevanis, AD. Bioinformatics: a practical guide to analysis of genes and proteins. John Wiley & Sons, 1998. [Signatura Biblioteca: BIOQUI.(2) 001.752]