Universidad Pública de Navarra



Año Académico: 2021/2022
Graduado o Graduada en Ciencia de Datos por la Universidad Pública de Navarra
Código: 505406 Asignatura: BIG DATA
Créditos: 6 Tipo: Obligatoria Curso: 4 Periodo: 2º S
Departamento: Estadística, Informática y Matemáticas
Profesorado:
SOTO RAMOS, SERGIO (Resp)   [Tutorías ]

Partes de este texto:

 

Módulo/Materia

  • Materia de Nivel 1: Minería de datos
  • Materia de Nivel 2: Minería de datos

Subir

Descripción/Contenidos

Manejo de grandes cantidades de datos. Modelo MapReduce. Tecnologías para el procesamiento masivo de datos. Procesamiento en tiempo real de grandes cantidades datos.

Subir

Competencias genéricas

  • CB2 - Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
  • CB4 - Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
  • CB5 - Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.

Subir

Competencias específicas

  • CG5- Identificar las soluciones más adecuadas y efectivas para los problemas que se planteen el marco de la Ciencia de Datos, teniendo en cuenta tanto las características propias del problema como el entorno del mismo.
  • CE14- Manejar, organizar información estadística e interpretar las técnicas de visualización y preprocesamiento de datos.
  • CE18- Comprender los conceptos fundamentales relacionados con los problemas que implican grandes volúmenes de datos.

Subir

Resultados aprendizaje

  • RA8. Explicar el concepto de Big Data.
  • RA9. Identificar técnicas de minería de datos apropiadas para el manejo de grandes volúmenes de datos.
  • RA10. Diseñar sistemas físicos capaces de procesar grandes volúmenes de datos a gran velocidad.
  • RA11. Evaluar la capacidad de un sistema para tratar grandes volúmenes de datos.

Subir

Metodología

Metodología-Actividad Horas presenciales No presenciales
A1- Clases expositivas/participativas 29 -
A2- Prácticas 28 -
A3- Realización de proyectos en grupo   10
A4- Estudio y trabajo autónomo del estudiante   80
A5- Tutorías y pruebas de evaluación 3 -

 

Subir

Evaluación

Resultados de aprendizaje Sistema de evaluación Peso (%) Carácter recuperable
RA8, RA9 Pruebas escritas 50
RA8, RA9,RA10,RA11 Presentaciones orales 10
RA9,RA10,RA11 Trabajos e informes 20
RA11 Pruebas e informes de trabajo experimental 20 No

 

Subir

Temario

  • 1. El impacto de los datos masivos en la sociedad actual
    • 1.1 Introducción
    • 1.2 Modelo de procesamiento y utilización de datos
    • 1.3 ¿Para qué se utilizan estos grandes conjuntos de datos?
    • 1.4 Tecnologías e infraestructuras
  • 2. Adquisición y almacenamiento de datos
    • 2.1 Introducción al ecosistema Apache/Hadoop
    • 2.2 Técnicas Sql y NoSql: consistencia, fiabilidad y escalabilidad
    • 2.3 Adquisición de datos
    • 2.4 Herramientas para el análisis de datos industrial
  • 3. Procesamiento y análisis de grandes volúmenes de datos
    • 3.1 Análisis exploratorio de datos
    • 3.2 Modelos de regresión y árboles
    • 3.3 Redes neuronales y técnicas no supervisadas
  • 4. Visualización de datos
    • 4.1 Contexto para la visualización de datos hoy
    • 4.2 Herramientas de análisis y visualización de datos
    • 4.3 El proceso de creación de una visualización de datos
    • 4.4 Otros aspectos de la visualización de datos

Subir

Programa de prácticas experimentales

  • 1. Adquisición y almacenamiento de datos
    • 1.1 Ecosistema apache hadoop
    • 1.2 Técnicas Sql y NoSql: consistencia, fiabilidad y escalabilidad
    • 1.3 Adquisición de datos
    • 1.4 Herramientas para el análisis de datos industrial
  • 2. Procesamiento y análisis
    • 2.1 La máquina virtual y otros (paquetería e inicio)
    • 2.2 Análisis exploratorio de datos y modelos de regresión
    • 2.3 Ärboles de regresión y clasificación
    • 2.4 Redes neuronales y técnicas no supervisadas
  • 3. Visualización de datos
    • 3.1 Herramientas de análisis y visualización de datos
    • 3.2 El proceso de creación de una visualización de datos
    • 3.3 Otros aspectos de la visualización de datos

Subir

Bibliografía

Acceda a la bibliografía que el profesorado de la asignatura ha solicitado a la Biblioteca.


La bibliografía básica de la asignatura es la siguiente:

  • Lublinsky, B. (2013). Hadoop Soluciones Big Data. Anaya SA.

La bibliografía complementaria de la asignatura es la siguiente:

  • Karau, H., Konwinski, A., Wendell, P., & Zaharia, M. (2015). Learning spark: lightning-fast big data analysis. " O'Reilly Media, Inc.".
  • Ryza, S., Laserson, U., Owen, S., & Wills, J. (2017). Advanced analytics with spark: patterns for learning from data at scale. " O'Reilly Media, Inc.".

Subir

Idiomas

Castellano

Subir

Lugar de impartición

Campus Arrosadía, Universidad Pública de Navarra.

Subir