Universidad Pública de Navarra



Año Académico: 2023/2024 | Otros años:  2022/2023  |  2021/2022  |  2020/2021  |  2019/2020 
Graduado o Graduada en Ingeniería en Tecnologías de Telecomunicación por la Universidad Pública de Navarra
Código: 243711 Asignatura: PROCESADO DE SEÑALES DE VOZ Y DE AUDIO
Créditos: 6 Tipo: Optativa Curso: 4 Periodo: 1º S
Departamento: Ingeniería Eléctrica, Electrónica y de Comunicación
Profesorado:
ARIZ GALILEA, MIKEL (Resp)   [Tutorías ]

Partes de este texto:

 

Módulo/Materia

Módulo: Formación específica en Sistemas audiovisuales y multimedia

Materia: Sonido e imagen

Subir

Descripción/Contenidos

 

 

Los sistemas de comunicación transportan información. Nos proponemos estudiar un sistema de comunicación específico: el de la comunicación a través de señales de voz, es decir señales acústicas tradicionalmente emitidas y recibidas por seres humanos en forma oral. Algunos de nuestros objetivos son la modelización, representación, análisis, modificación, codificación y mejora de la relación señal/ruido. Estos principios básicos para aplicaciones más avanzadas como la  generación artificial de mensajes vocales inteligibles para el ser humano y el reconocimiento automático de mensajes vocales pronunciados por seres humanos.

 

 

Subir

Competencias genéricas

G2- Trabajo en equipo

G3- Aprendizaje autónomo

G4- Eficacia en la comunicación oral y escrita con capacitación lingüística en  inglés

G5- Eficacia en el manejo de recursos de información

G7- Capacidad para concebir, diseñar, implementar y operar sistemas y servicios en el ámbito de las TIC.

 

Subir

Competencias específicas

3.7- Capacidad de construir, explotar y gestionar servicios y aplicaciones de telecomunicaciones, entendidas éstas como sistemas de captación, tratamiento analógico y digital, codificación, transporte, representación, procesado, almacenamiento, reproducción, gestión y presentación de servicios audiovisuales e información multimedia.

 

3.25- Capacidad para realizar proyectos de locales e instalaciones destinados a la producción y grabación de señales de audio y vídeo.

 

3.27- Capacidad para crear, codificar, gestionar, difundir y distribuir contenidos multimedia, atendiendo a criterios de usabilidad y accesibilidad de los servicios audiovisuales, de difusión e interactivos.

 

Subir

Resultados aprendizaje

- Explicar y utilizar los sistemas asociados a la adquisición y acondicionamiento de señales audio, imagen y video.

 

- Describir y Utilizar estándares de adquisición, transmisión y almacenamiento de información multimedia: audio, imagen y video.

 

- Describir y aplicar las técnicas de codificación y compresión de información multimedia: audio, imagen y video.

 

- Describir y aplicar las herramientas de análisis específicas para señales de audio: correlación, lpc, cepstral, detección del pitch, etc.

 

- Describir y aplicar las herramientas de análisis específicas para señales de imagen: procesado espacial, frecuencial, restauración, morfología, segmentación, descripción, color, etc.

 

- Construir sistemas de síntesis digital de audio.

 

Subir

Metodología

 

 

Metodología ¿ Actividad Horas presenciales Horas no presenciales
A1     Clases expositivas 25 25
A3     Prácticas guiadas en el laboratorio 30 25
A4     Exámenes y pruebas de evaluación individuales 5 10
A5     Estudio y trabajo autónomo del estudiante 0 30
Total 60 90

Subir

Idiomas

Castellano

Subir

Evaluación

 

Resultados de
aprendizaje
Actividad de
evaluación
Peso (%) Carácter
recuperable
Nota mínima
requerida
sistemas asociados a la adquisición y acondicionamiento de señales audio prueba teórica 15  
estándares de adquisición, transmisión y almacenamiento de información audio prueba teórica 15  
 técnicas de codificación y compresión de información audio prueba teórica 20  
 herramientas de análisis específicas para señales de audio test de prácticas 30 no  
sistemas de síntesis digital de audio proyecto 20 no  

 

Subir

Temario

1. Introducción
1.1 Introducción al procesado digital de voz y audio y sus aplicaciones.

2. Generación de la voz humana
2.1 Anatomía del aparato fonador.
2.2 Pitch y formantes
2.3 Clasificación de los sonidos de la voz - sonoridad

3. Técnicas básicas de análisis
3.1 Análisis en el dominio del tiempo y análisis localizado.
3.2 Análisis en el dominio de la frecuencia.

4. Codificación de voz y audio
4.1 Clasificación de codificadores
4.2 Estimación de pitch
4.3 Codificación lineal predictiva
4.4 Análisis homomórfico (cepstral)
4.5 Codificador paramétrico

5. Modelos de señal de audio y estimación
5.1 Variable aleatoria, distribución y covarianza
5.2 Estimador de mínimos cuadrados
5.3 Modelado armónico de señales de audio

6. Restauración de audio
6.1 Modelado no estacionario de señales de audio
6.2 Eliminación de ruido de fondo
6.3 Eliminación de ruido impulsivo

7. Separación de fuentes de voz y audio
7.1 Introducción al concepto de separación ciega ("Blind source separation")
7.2 Método "Projection pursuit"
7.3 Separación en componentes independientes (ICA)

Subir

Programa de prácticas experimentales

Sesión 1: Introducción a PSVA
Sesión 2: Análisis de señales de voz y audio
Sesión 3: Estimación de pitch
Sesión 4: Modelado y estimación de señales
Sesión 5: Restauración de audio
Sesión 6: Separación de fuentes
Sesión 7 - 10: Proyecto

Subir

Bibliografía

Acceda a la bibliografía que el profesorado de la asignatura ha solicitado a la Biblioteca.


L. Rabiner, R.W. Schafer, "Digital Processing of Speech Signals". Prentice-Hall, 1978.

T. F. Quattieri, "Discrete-Time Speech Signal Processing. Principles and Applications". Prentice-Hall, 2002.

A. Spanias, T. Painter, V. Atti, "Audio Signal Processing and Coding". Wiley, 2006.

R. Goldberg, L. Riek, "A practical handbook of speech coders". CRC Press, 2000.

D. O'Shaughnessy, "Speech Communications. Human and Machine (2nd. Ed.)". IEEE Press 2000.

B. Gold, N. Morgan, "Speech and audio signal processing". John Wiley & Sons, 2000.

L. Rabiner, B.H. Juang, "Fundamenatls of speech recognition". Prentice-Hall, 1993.

 

Subir