Módulo/Materia
- Materia de Nivel 1: Minería de datos
- Materia de Nivel 2: Minería de datos
Subir
Descripción/Contenidos
Manejo de grandes cantidades de datos. Modelo MapReduce. Tecnologías para el procesamiento masivo de datos. Procesamiento en tiempo real de grandes cantidades datos.
Subir
Competencias genéricas
- CB2 - Que los estudiantes sepan aplicar sus conocimientos a su trabajo o vocación de una forma profesional y posean las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio.
- CB4 - Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tanto especializado como no especializado.
- CB5 - Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía.
Subir
Competencias específicas
- CG5- Identificar las soluciones más adecuadas y efectivas para los problemas que se planteen el marco de la Ciencia de Datos, teniendo en cuenta tanto las características propias del problema como el entorno del mismo.
- CE14- Manejar, organizar información estadística e interpretar las técnicas de visualización y preprocesamiento de datos.
- CE18- Comprender los conceptos fundamentales relacionados con los problemas que implican grandes volúmenes de datos.
Subir
Resultados aprendizaje
- RA8. Explicar el concepto de Big Data.
- RA9. Identificar técnicas de minería de datos apropiadas para el manejo de grandes volúmenes de datos.
- RA10. Diseñar sistemas físicos capaces de procesar grandes volúmenes de datos a gran velocidad.
- RA11. Evaluar la capacidad de un sistema para tratar grandes volúmenes de datos.
Subir
Metodología
Metodología-Actividad |
Horas presenciales |
No presenciales |
A1- Clases expositivas/participativas |
30 |
- |
A2- Prácticas |
28 |
- |
A3- Realización de proyectos en grupo |
- |
10 |
A4- Estudio y trabajo autónomo del estudiante |
- |
78 |
A5- Tutorías |
- |
2 |
A6- Pruebas de evaluación |
2 |
- |
Subir
Evaluación
Resultados de aprendizaje |
Actividad de evaluación |
Peso (%) |
Carácter recuperable |
Nota mínima requerida |
RA8, RA9 |
Pruebas escritas |
50 |
Si |
5 |
RA8, RA9,RA10,RA11 |
Presentaciones orales |
10 |
Si |
5 |
RA9,RA10,RA11 |
Trabajos e informes |
20 |
Sí |
5 |
RA11 |
Pruebas e informes de trabajo experimental |
20 |
No |
|
Si en alguna de las actividades no se cumpliera el mínimo para ponderar, la nota de la asignatura será como máximo 4,9 sobre 10 (suspenso).
Subir
Temario
- 1. El impacto de los datos masivos en la sociedad actual
- 1.1 Introducción
- 1.2 Modelo de procesamiento y utilización de datos
- 1.3 ¿Para qué se utilizan estos grandes conjuntos de datos?
- 1.4 Tecnologías e infraestructuras
- 2. Adquisición y almacenamiento de datos
- 2.1 Introducción al ecosistema Apache/Hadoop
- 2.2 Técnicas Sql y NoSql: consistencia, fiabilidad y escalabilidad
- 2.3 Adquisición de datos
- 2.4 Herramientas para el análisis de datos industrial
- 3. Procesamiento y análisis de grandes volúmenes de datos
- 3.1 Análisis exploratorio de datos
- 3.2 Modelos de regresión y árboles
- 3.3 Redes neuronales y técnicas no supervisadas
- 4. Visualización de datos
- 4.1 Contexto para la visualización de datos hoy
- 4.2 Herramientas de análisis y visualización de datos
- 4.3 El proceso de creación de una visualización de datos
- 4.4 Otros aspectos de la visualización de datos
Subir
Programa de prácticas experimentales
- 1. Adquisición y almacenamiento de datos
- 1.1 Ecosistema apache hadoop
- 1.2 Técnicas Sql y NoSql: consistencia, fiabilidad y escalabilidad
- 1.3 Adquisición de datos
- 1.4 Herramientas para el análisis de datos industrial
- 2. Procesamiento y análisis
- 2.1 La máquina virtual y otros (paquetería e inicio)
- 2.2 Análisis exploratorio de datos y modelos de regresión
- 2.3 Ärboles de regresión y clasificación
- 2.4 Redes neuronales y técnicas no supervisadas
- 3. Visualización de datos
- 3.1 Herramientas de análisis y visualización de datos
- 3.2 El proceso de creación de una visualización de datos
- 3.3 Otros aspectos de la visualización de datos
Subir
Bibliografía
Acceda a la bibliografía que el profesorado de la asignatura ha solicitado a la Biblioteca.
La bibliografía básica de la asignatura es la siguiente:
- Lublinsky, B. (2013). Hadoop Soluciones Big Data. Anaya SA.
La bibliografía complementaria de la asignatura es la siguiente:
- Karau, H., Konwinski, A., Wendell, P., & Zaharia, M. (2015). Learning spark: lightning-fast big data analysis. " O'Reilly Media, Inc.".
- Ryza, S., Laserson, U., Owen, S., & Wills, J. (2017). Advanced analytics with spark: patterns for learning from data at scale. " O'Reilly Media, Inc.".
Subir
Lugar de impartición
Campus Arrosadía, Universidad Pública de Navarra.
Subir