Universidad Pública de Navarra



Año Académico: 2025/2026 | Otros años:  2024/2025  |  2023/2024 
Graduado o Graduada en Ciencia de Datos/Graduado o Graduada en Administración y Dirección de Empresas por la Universidad Pública de Navarra
Código: 507510 Asignatura: BIG DATA
Créditos: 6 Tipo: Obligatoria Curso: 5 Periodo: 2º S
Departamento: Estadística, Informática y Matemáticas
Profesorado:
MARCO DETCHART, CEDRIC (Resp)   [Tutorías ]

Partes de este texto:

 

Módulo/Materia

  • Materia de Nivel 1: Minería de datos
  • Materia de Nivel 2: Minería de datos

Subir

Descripción/Contenidos

Manejo de grandes cantidades de datos. Modelo MapReduce. Tecnologías para el procesamiento masivo de datos. Procesamiento en tiempo real de grandes cantidades datos.

Subir

Competencias genéricas

No aplica

Subir

Competencias específicas

No aplica

Subir

Resultados aprendizaje

RA05 - Identificar las soluciones más adecuadas y efectivas para los problemas que se planteen el marco de la Ciencia de Datos, teniendo en cuenta tanto las características propias del problema como el entorno del mismo TIPO: Conocimientos o contenidos
RA26 - Manejar, organizar información estadística e interpretar las técnicas de visualización y preprocesamiento de dato TIPO: Competencias
RA30 - Comprender los conceptos fundamentales relacionados con los problemas que implican grandes volúmenes de datos TIPO: Competencias

Subir

Metodología

Metodología-Actividad Horas presenciales No presenciales
A1- Clases expositivas/participativas 30 -
A2- Prácticas 28 -
A3- Realización de proyectos en grupo - 10
A4- Estudio y trabajo autónomo del estudiante - 78
A5- Tutorías  - 2
A6- Pruebas de evaluación 2 -

 

Subir

Evaluación

 

Actividad de
evaluación
Peso (%) Carácter
recuperable
Nota mínima
requerida
SE1- Pruebas escritas 50 Si 5
SE3- Presentaciones orales 10 Si 5
SE4- Trabajos e informes 20 5
SE5- Pruebas e informes de trabajo experimental 20 No  

Si en alguna de las actividades no se cumpliera el mínimo para ponderar, la nota de la asignatura será como máximo 4,9 sobre 10 (suspenso).

Subir

Temario

  • 1. El impacto de los datos masivos en la sociedad actual
    • 1.1 Introducción
    • 1.2 Modelo de procesamiento y utilización de datos
    • 1.3 ¿Para qué se utilizan estos grandes conjuntos de datos?
    • 1.4 Tecnologías e infraestructuras
  • 2. Adquisición y almacenamiento de datos
    • 2.1 Introducción al ecosistema Apache/Hadoop
    • 2.2 Técnicas Sql y NoSql: consistencia, fiabilidad y escalabilidad
    • 2.3 Adquisición de datos
    • 2.4 Herramientas para el análisis de datos industrial
  • 3. Procesamiento y análisis de grandes volúmenes de datos
    • 3.1 Análisis exploratorio de datos
    • 3.2 Modelos de regresión y árboles
    • 3.3 Redes neuronales y técnicas no supervisadas
  • 4. Visualización de datos
    • 4.1 Contexto para la visualización de datos hoy
    • 4.2 Herramientas de análisis y visualización de datos
    • 4.3 El proceso de creación de una visualización de datos
    • 4.4 Otros aspectos de la visualización de datos

Subir

Programa de prácticas experimentales

  • 1. Adquisición y almacenamiento de datos
    • 1.1 Ecosistema apache hadoop
    • 1.2 Técnicas Sql y NoSql: consistencia, fiabilidad y escalabilidad
    • 1.3 Adquisición de datos
    • 1.4 Herramientas para el análisis de datos industrial
  • 2. Procesamiento y análisis
    • 2.1 La máquina virtual y otros (paquetería e inicio)
    • 2.2 Análisis exploratorio de datos y modelos de regresión
    • 2.3 Árboles de regresión y clasificación
    • 2.4 Redes neuronales y técnicas no supervisadas
  • 3. Visualización de datos
    • 3.1 Herramientas de análisis y visualización de datos
    • 3.2 El proceso de creación de una visualización de datos
    • 3.3 Otros aspectos de la visualización de datos

Subir

Bibliografía

Acceda a la bibliografía que el profesorado de la asignatura ha solicitado a la Biblioteca.


La bibliografía básica de la asignatura es la siguiente:

La bibliografía complementaria de la asignatura es la siguiente:

  • Karau, H., Konwinski, A., Wendell, P., & Zaharia, M. (2015). Learning spark: lightning-fast big data analysis. " O'Reilly Media, Inc.".
  • Chambers, B., Zaharia, M. (2018). Spark: The Definitive Guide: Big Data Processing Made Simple. " O'Reilly Media, Inc.".
  • Ryza, S., Laserson, U., Owen, S., & Wills, J. (2017). Advanced analytics with spark: patterns for learning from data at scale. " O'Reilly Media, Inc.".

Subir

Idiomas

Castellano

Subir

Lugar de impartición

Campus Arrosadía, Universidad Pública de Navarra.

Subir