Universidad Pública de Navarra



Año Académico: 2024/2025 | Otros años:  2023/2024  |  2022/2023  |  2021/2022 
Graduado o Graduada en Ciencia de Datos por la Universidad Pública de Navarra
Código: 505406 Asignatura: BIG DATA
Créditos: 6 Tipo: Obligatoria Curso: 4 Periodo: 2º S
Departamento: Estadística, Informática y Matemáticas
Profesorado:
SOTO RAMOS, SERGIO (Resp)   [Tutorías ]

Partes de este texto:

 

Módulo/Materia

  • Materia de Nivel 1: Minería de datos
  • Materia de Nivel 2: Minería de datos

Subir

Descripción/Contenidos

Manejo de grandes cantidades de datos. Modelo MapReduce. Tecnologías para el procesamiento masivo de datos. Procesamiento en tiempo real de grandes cantidades datos.

Subir

Competencias genéricas

  • CB2 - Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  • CB4 - Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
  • CB5 - Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.

Subir

Competencias específicas

  • CG5- Identificar las soluciones más adecuadas y efectivas para los problemas que se planteen el marco de la Ciencia de Datos, teniendo en cuenta tanto las características propias del problema como el entorno del mismo.
  • CE14- Manejar, organizar información estadística e interpretar las técnicas de visualización y preprocesamiento de datos.
  • CE18- Comprender los conceptos fundamentales relacionados con los problemas que implican grandes volúmenes de datos.

Subir

Resultados aprendizaje

  • RA8. Explicar el concepto de Big Data.
  • RA9. Identificar técnicas de minería de datos apropiadas para el manejo de grandes volúmenes de datos.
  • RA10. Diseñar sistemas físicos capaces de procesar grandes volúmenes de datos a gran velocidad.
  • RA11. Evaluar la capacidad de un sistema para tratar grandes volúmenes de datos.

Subir

Metodología

Metodología-Actividad Horas presenciales No presenciales
A1- Clases expositivas/participativas 30 -
A2- Prácticas 28 -
A3- Realización de proyectos en grupo - 10
A4- Estudio y trabajo autónomo del estudiante - 78
A5- Tutorías y pruebas de evaluación - 2
A6- Pruebas de evaluación 2 -

 

Subir

Evaluación

 

Resultados de
aprendizaje
Actividad de
evaluación
Peso (%) Carácter
recuperable
Nota mínima
requerida
RA8, RA9 Pruebas escritas 50 Si 5
RA8, RA9,RA10,RA11 Presentaciones orales 10 Si 5
RA9,RA10,RA11 Trabajos e informes 20 5
RA11 Pruebas e informes de trabajo experimental 20 No  

Si en alguna de las actividades no se cumpliera el mínimo para ponderar, la nota de la asignatura será como máximo 4,9 sobre 10 (suspenso).

Subir

Temario

  • 1. El impacto de los datos masivos en la sociedad actual
    • 1.1 Introducción
    • 1.2 Modelo de procesamiento y utilización de datos
    • 1.3 ¿Para qué se utilizan estos grandes conjuntos de datos?
    • 1.4 Tecnologías e infraestructuras
  • 2. Adquisición y almacenamiento de datos
    • 2.1 Introducción al ecosistema Apache/Hadoop
    • 2.2 Técnicas Sql y NoSql: consistencia, fiabilidad y escalabilidad
    • 2.3 Adquisición de datos
    • 2.4 Herramientas para el análisis de datos industrial
  • 3. Procesamiento y análisis de grandes volúmenes de datos
    • 3.1 Análisis exploratorio de datos
    • 3.2 Modelos de regresión y árboles
    • 3.3 Redes neuronales y técnicas no supervisadas
  • 4. Visualización de datos
    • 4.1 Contexto para la visualización de datos hoy
    • 4.2 Herramientas de análisis y visualización de datos
    • 4.3 El proceso de creación de una visualización de datos
    • 4.4 Otros aspectos de la visualización de datos

Subir

Programa de prácticas experimentales

  • 1. Adquisición y almacenamiento de datos
    • 1.1 Ecosistema apache hadoop
    • 1.2 Técnicas Sql y NoSql: consistencia, fiabilidad y escalabilidad
    • 1.3 Adquisición de datos
    • 1.4 Herramientas para el análisis de datos industrial
  • 2. Procesamiento y análisis
    • 2.1 La máquina virtual y otros (paquetería e inicio)
    • 2.2 Análisis exploratorio de datos y modelos de regresión
    • 2.3 Ärboles de regresión y clasificación
    • 2.4 Redes neuronales y técnicas no supervisadas
  • 3. Visualización de datos
    • 3.1 Herramientas de análisis y visualización de datos
    • 3.2 El proceso de creación de una visualización de datos
    • 3.3 Otros aspectos de la visualización de datos

Subir

Bibliografía

Acceda a la bibliografía que el profesorado de la asignatura ha solicitado a la Biblioteca.


La bibliografía básica de la asignatura es la siguiente:

La bibliografía complementaria de la asignatura es la siguiente:

  • Karau, H., Konwinski, A., Wendell, P., & Zaharia, M. (2015). Learning spark: lightning-fast big data analysis. " O'Reilly Media, Inc.".
  • Ryza, S., Laserson, U., Owen, S., & Wills, J. (2017). Advanced analytics with spark: patterns for learning from data at scale. " O'Reilly Media, Inc.".

Subir

Idiomas

Castellano

Subir

Lugar de impartición

Campus Arrosadía, Universidad Pública de Navarra.

Subir