El ingeniero industrial Erick Orozco Acosta ha desarrollado en su tesis doctoral, defendida en la Universidad Pública de Navarra (UPNA), nuevos modelos estadísticos que permiten la estimación de riesgos de mortalidad e incidencia de cáncer y otras enfermedades crónicas en regiones grandes constituidas por un conjunto notable de áreas pequeñas, como es el caso de municipios o secciones censales en España. La tesis ha sido dirigida por la catedrática de Estadística e Investigación Operativa, además de directora del instituto INAMAT2, Lola Ugarte Martínez; y por el profesor Aritz Adin Urtasun, vinculado al mismo instituto.
Además del objetivo principal ya citado, entre los propósitos de la investigación desarrollada se encuentra el de predecir casos de cáncer y otras enfermedades crónicas a corto plazo en el tipo de regiones mencionadas, “ya que los registros de incidencia y mortalidad no están, normalmente, actualizados, y presentan los datos con un retraso aproximado de tres años”, indica el autor de la tesis.
Metodología empleada y propuestas
En la investigación doctoral se proponen métodos de modelización bayesiana escalable para el tratamiento de datos de área espaciales y/o espacio-temporales de alta dimensión basados en la idea de “divide y vencerás” (una expresión utilizada en lenguaje algorítmico que se refiere a descomponer un problema en otros para un mejor manejo). Además, se evalúa la efectividad de estos métodos en la predicción a corto plazo de datos con alta resolución espacial. “Los estudios de simulación y análisis de datos reales realizados revelan que algunos modelos clásicos son, en ocasiones, computacionalmente inviables, y los modelos propuestos tienen mejores resultados estadísticos de bondad de ajuste, menor uso memoria RAM/CPU y mejores tiempos computacionales en comparación con los modelos clásicos”, explica el autor de la tesis. Además, tal y como señala, los modelos propuestos son “más flexibles, ya que no asumen un único parámetro de suavizado en todo el dominio espacial, superando así una limitación común en los modelos clásicos”. En cuanto a la viabilidad de los modelos propuestos, Erick Orozco concluye que “las medidas de bondad de ajuste y de validación cruzada” indican que son una alternativa práctica y efectiva” a los modelos clásicos.
Por otro lado, en la investigación se elaboró también un paquete estadístico en lenguaje R denominado bigDM, donde se implementaron todos los métodos y algoritmos propuestos en la tesis para poner a disposición de la comunidad científica todo el trabajo desarrollado. El paquete dispone de una versión estable en el repositorio de paquetes de R conocido como CRAN (acrónimo de Comprehensive R Archive Network) en y una versión de desarrollo en un repositorio en github, donde se puede encontrar las funcionalidades y ejemplos prácticos del paquete. Actualmente, este último tiene más de 6000 descargas en CRAN.
Breve CV de Erick Orozco
Erick Orozco Acosta es ingeniero industrial por la Universidad Simón Bolívar (Colombia) y máster en estadística aplicada de la Universidad del Norte (Colombia). Durante la tesis, llevó a cabo dos estancias en el departamento de matemáticas de la Universidad Noruega de Ciencia y Tecnología (NTNU, por sus siglas en noruego) en Trondheim-Noruega bajo la supervisión de la profesora Andrea Riebler.
Erick Orozco es profesor de la Universidad Simón Bolívar (Colombia) e investigador senior por el Ministerio de Ciencia, Tecnología e Innovación de Colombia. Cuenta con 12 años de experiencia trabajando como profesor y ha sido investigador principal de un proyecto cofinanciado por el mencionado ministerio en analítica de datos.