Universidad PÃÂºblica de Navarra - Nafarroako Univertsitate Publikoa

Universidad Pública de Navarra

Año Académico: 2021/2022 | Otros años: 2020/2021 | 2019/2020 | 2018/2019 | 2017/2018

Graduado o Graduada en Ingeniería en Tecnologías de Telecomunicación por la Universidad Pública de Navarra
Código: 243711	Asignatura: PROCESADO DE SEÑALES DE VOZ Y DE AUDIO
Créditos: 6	Tipo: Optativa	Curso: 4	Periodo: 1º S
Departamento: Ingeniería Eléctrica, Electrónica y de Comunicación
Profesorado:
ZIVANOVIC ., MIROSLAV (Resp) [Tutorías ]

Partes de este texto:

Módulo/Materia
Descripción/Contenidos
Competencias genéricas
Competencias específicas
Resultados aprendizaje
Metodología
Idiomas
Evaluación
Temario
Programa de prácticas experimentales
Bibliografía
Lugar de impartición
Mostrar todos los apartados

Módulo/Materia

Módulo: Formación específica en Sistemas audiovisuales y multimedia

Materia: Sonido e imagen

Subir

Descripción/Contenidos

Los sistemas de comunicación transportan información. Nos proponemos estudiar un sistema de comunicación específico: el de la comunicación a través de señales de voz, es decir señales acústicas tradicionalmente emitidas y recibidas por seres humanos en forma oral. Algunos de nuestros objetivos son la modelización, representación, análisis, modificación, codificación y mejora de la relación señal/ruido. Estos principios básicos para aplicaciones más avanzadas como la generación artificial de mensajes vocales inteligibles para el ser humano y el reconocimiento automático de mensajes vocales pronunciados por seres humanos.

Subir

Competencias genéricas

G2- Trabajo en equipo

G3- Aprendizaje autónomo

G4- Eficacia en la comunicación oral y escrita con capacitación lingüística en inglés

G5- Eficacia en el manejo de recursos de información

G7- Capacidad para concebir, diseñar, implementar y operar sistemas y servicios en el ámbito de las TIC.

Subir

Competencias específicas

3.7- Capacidad de construir, explotar y gestionar servicios y aplicaciones de telecomunicaciones, entendidas éstas como sistemas de captación, tratamiento analógico y digital, codificación, transporte, representación, procesado, almacenamiento, reproducción, gestión y presentación de servicios audiovisuales e información multimedia.

3.25- Capacidad para realizar proyectos de locales e instalaciones destinados a la producción y grabación de señales de audio y vídeo.

3.27- Capacidad para crear, codificar, gestionar, difundir y distribuir contenidos multimedia, atendiendo a criterios de usabilidad y accesibilidad de los servicios audiovisuales, de difusión e interactivos.

Subir

Resultados aprendizaje

- Explicar y utilizar los sistemas asociados a la adquisición y acondicionamiento de señales audio, imagen y video.

- Describir y Utilizar estándares de adquisición, transmisión y almacenamiento de información multimedia: audio, imagen y video.

- Describir y aplicar las técnicas de codificación y compresión de información multimedia: audio, imagen y video.

- Describir y aplicar las herramientas de análisis específicas para señales de audio: correlación, lpc, cepstral, detección del pitch, etc.

- Describir y aplicar las herramientas de análisis específicas para señales de imagen: procesado espacial, frecuencial, restauración, morfología, segmentación, descripción, color, etc.

- Construir sistemas de síntesis digital de audio.

Subir

Metodología

Metodología ¿ Actividad	Horas presenciales	Horas no presenciales
A1 Clases expositivas	25	25
A3 Prácticas guiadas en el laboratorio	30	25
A4 Exámenes y pruebas de evaluación individuales	5	10
A5 Estudio y trabajo autónomo del estudiante	0	30
Total	60	90

Subir

Idiomas

Castellano

Subir

Evaluación

Resultado de aprendizaje	Sistema de evaluación	Peso (%)	Carácter recuperable
sistemas asociados a la adquisición y acondicionamiento de señales audio	prueba teórica	15	sí
estándares de adquisición, transmisión y almacenamiento de información audio	prueba teórica	15	sí
técnicas de codificación y compresión de información audio	prueba teórica	20	sí
herramientas de análisis específicas para señales de audio	test de prácticas	30	no
sistemas de síntesis digital de audio	proyecto	20	no

Subir

Temario

1- Introducción

1.1. Mecanismos de la comunicación por voz.

1.2. Introducción al procesado digital de voz y sus aplicaciones.

2- Generación de la voz humana

2.1. Anatomía del aparato fonador.

2.2. Clasificación de los sonidos de la voz.

2.2.1. Vocales y consonantes.

2.2.2. Oralidad y nasalidad.

2.2.3. Sonoridad.

2.2.4. Lugar y modo de articulación.

2.2.5. Posición de los órganos articuladores.

2.3. Modelado acústico de la voz.

2.3.1. Modelo convolucional.

2.3.2. Excitación periódica.

2.3.3. Tracto vocal.

2.3.4. Ejemplos.

3- El oído y la percepción de la voz

3.1. Anatomía y fisiología del oído.

3.1.1. Introducción.

3.1.2. Oído externo.

3.1.3. Oído medio.

3.1.3. Oído interno.

3.2. Percepción del sonido.

3.2.1. Rango dinámico y respuesta en frecuencia del oído.

3.2.2. Localización del sonido.

3.2.3. Enmascaramiento.

3.2.3.1. Enmascaramiento frecuencial

3.2.3.2. Enmascaramiento temporal.

3.2.4. Bandas críticas.

3.2.5. Percepción del pitch.

4- Técnicas básicas de análisis de la señal de voz

4.1. Introducción.

4.2. Análisis en el dominio del tiempo y análisis localizado.

4.2.1. Energía y amplitud a corto plazo.

4.2.2. Tasa de cruces por cero.

4.2.3. Discriminación sonoro/sordo/silencio..

4.2.4. Funciones de autocorrelación.

4.2.5. Autocorrelación localizada..

4.2.6. Diferencia de amplitud a corto plazo.

4.2.7. Estimación de la frecuencia fundamental.

4.3. Análisis en el dominio de la frecuencia.

4.3.1. Banco de filtros.

4.3.2. Tranformada localizada de Fourier.

5- Codificación de voz

5.1. Introducción.

5.2. Codificadores de forma de onda.

5.2.1. Cuantificación PCM.

5.2.2. Cuantificación PCM no uniforme. Compansores.

5.2.3. Cuantificación adaptativa (APCM).

5.2.4. Cuantificación diferencial (DPCM).

5.2.5. Cuantificación delta lineal.

5.2.6. Cuantificación diferencial adaptativa (ADPCM)

5.2.7. Comparación de prestaciones.

5.3. Vocoders.

5.3.1. Vocoder LPC.

5.4. Codificadores híbridos.

5.4.1. Codificación multipulso.

5.4.2. Codificación CELP.

5.4.3. Codificación en subbandas.

6- Codificación de audio

6.1. Introducción.

6.2. Umbral absoluto de adicción.

6.3. Bandas críticas.

6.4. Enmascaramiento simultaneo.

6.5. Enmascaramiento no simultaneo.

6.6. Codificación basada en la entropía perceptual.

Subir

Programa de prácticas experimentales

1. Introducción al procesado de señales de voz y audio

2. Implementación de efectos acústicos

3. Técnicas de análisis de señales de voz

4. Estimación de pitch

5. Codificadores de forma de onda (I)

6. Codificadores de forma de onda (II)

Subir

Bibliografía

Acceda a la bibliografía que el profesorado de la asignatura ha solicitado a la Biblioteca.

L. Rabiner, R.W. Schafer, ¿Digital Processing of Speech Signals¿. Prentice-Hall, 1978.

T. F. Quattieri, ¿Discrete-Time Speech Signal Processing. Principles and Applications¿. Prentice-Hall, 2002.

A. Spanias, T. Painter, V. Atti, ¿Audio Signal Processing and Coding¿. Wiley, 2006.

R. Goldberg, L. Riek, ¿A practical handbook of speech coders¿. CRC Press, 2000.

D. O¿Shaughnessy, ¿Speech Communications. Human and Machine (2nd. Ed.)¿. IEEE Press 2000.

B. Gold, N. Morgan, ¿Speech and audio signal processing¿. John Wiley & Sons, 2000.

L. Rabiner, B.H. Juang, ¿Fundamenatls of speech recognition¿. Prentice-Hall, 1993.

Subir

Universidad PÃÂºblica de Navarra - Nafarroako Univertsitate Publikoa

Universidad Pública de Navarra

Módulo/Materia

Descripción/Contenidos

Competencias genéricas

Competencias específicas

Resultados aprendizaje

Metodología

Idiomas

Evaluación

Temario

Programa de prácticas experimentales

Bibliografía

Universidad PÃÂºblica de Navarra - Nafarroako Univertsitate Publikoa