Módulo/Materia
- Materia de Nivel 1: Minería de datos
- Materia de Nivel 2: Minería de datos
Subir
Descripción/Contenidos
Manejo de grandes cantidades de datos. Modelo MapReduce. Tecnologías para el procesamiento masivo de datos. Procesamiento en tiempo real de grandes cantidades datos.
Subir
Competencias genéricas
No aplica
Subir
Competencias específicas
No aplica
Subir
Resultados aprendizaje
RA05 - Identificar las soluciones más adecuadas y efectivas para los problemas que se planteen el marco de la Ciencia de Datos, teniendo en cuenta tanto las características propias del problema como el entorno del mismo TIPO: Conocimientos o contenidos
RA26 - Manejar, organizar información estadística e interpretar las técnicas de visualización y preprocesamiento de dato TIPO: Competencias
RA30 - Comprender los conceptos fundamentales relacionados con los problemas que implican grandes volúmenes de datos TIPO: Competencias
Subir
Metodología
Metodología-Actividad |
Horas presenciales |
No presenciales |
A1- Clases expositivas/participativas |
30 |
- |
A2- Prácticas |
28 |
- |
A3- Realización de proyectos en grupo |
- |
10 |
A4- Estudio y trabajo autónomo del estudiante |
- |
78 |
A5- Tutorías |
- |
2 |
A6- Pruebas de evaluación |
2 |
- |
Subir
Evaluación
Actividad de evaluación |
Peso (%) |
Carácter recuperable |
Nota mínima requerida |
SE1- Pruebas escritas |
50 |
Si |
5 |
SE3- Presentaciones orales |
10 |
Si |
5 |
SE4- Trabajos e informes |
20 |
Sí |
5 |
SE5- Pruebas e informes de trabajo experimental |
20 |
No |
|
Si en alguna de las actividades no se cumpliera el mínimo para ponderar, la nota de la asignatura será como máximo 4,9 sobre 10 (suspenso).
Subir
Temario
- 1. El impacto de los datos masivos en la sociedad actual
- 1.1 Introducción
- 1.2 Modelo de procesamiento y utilización de datos
- 1.3 ¿Para qué se utilizan estos grandes conjuntos de datos?
- 1.4 Tecnologías e infraestructuras
- 2. Adquisición y almacenamiento de datos
- 2.1 Introducción al ecosistema Apache/Hadoop
- 2.2 Técnicas Sql y NoSql: consistencia, fiabilidad y escalabilidad
- 2.3 Adquisición de datos
- 2.4 Herramientas para el análisis de datos industrial
- 3. Procesamiento y análisis de grandes volúmenes de datos
- 3.1 Análisis exploratorio de datos
- 3.2 Modelos de regresión y árboles
- 3.3 Redes neuronales y técnicas no supervisadas
- 4. Visualización de datos
- 4.1 Contexto para la visualización de datos hoy
- 4.2 Herramientas de análisis y visualización de datos
- 4.3 El proceso de creación de una visualización de datos
- 4.4 Otros aspectos de la visualización de datos
Subir
Programa de prácticas experimentales
- 1. Adquisición y almacenamiento de datos
- 1.1 Ecosistema apache hadoop
- 1.2 Técnicas Sql y NoSql: consistencia, fiabilidad y escalabilidad
- 1.3 Adquisición de datos
- 1.4 Herramientas para el análisis de datos industrial
- 2. Procesamiento y análisis
- 2.1 La máquina virtual y otros (paquetería e inicio)
- 2.2 Análisis exploratorio de datos y modelos de regresión
- 2.3 Árboles de regresión y clasificación
- 2.4 Redes neuronales y técnicas no supervisadas
- 3. Visualización de datos
- 3.1 Herramientas de análisis y visualización de datos
- 3.2 El proceso de creación de una visualización de datos
- 3.3 Otros aspectos de la visualización de datos
Subir
Bibliografía
Acceda a la bibliografía que el profesorado de la asignatura ha solicitado a la Biblioteca.
La bibliografía básica de la asignatura es la siguiente:
La bibliografía complementaria de la asignatura es la siguiente:
- Karau, H., Konwinski, A., Wendell, P., & Zaharia, M. (2015). Learning spark: lightning-fast big data analysis. " O'Reilly Media, Inc.".
- Chambers, B., Zaharia, M. (2018). Spark: The Definitive Guide: Big Data Processing Made Simple. " O'Reilly Media, Inc.".
- Ryza, S., Laserson, U., Owen, S., & Wills, J. (2017). Advanced analytics with spark: patterns for learning from data at scale. " O'Reilly Media, Inc.".
Subir
Lugar de impartición
Campus Arrosadía, Universidad Pública de Navarra.
Subir