Ir a Contenido Principal

AURORA - Sistema de Información Académico

 

AYUDA | SALIR

Información detallada de curso

 

Primer semestre 2017
Abr 18, 2024
Imagen transparente
1. IDENTIFICACION DEL CURSO

Código y Nombre de la Asignatura: IEN 8500 - DISEÑO DE HARDWARE DE ALTO DESEMPEÑO
División Académica: División de Ingenierías
Departamento Académico: Dpto.Ing Eléctrica-Electrónica
Número de créditos:
Intensidad horaria (semanal para nivel pregrado y total para nivel postgrado):
3.000 Horas de Teoría
0.000 Horas de Laboratorio
Niveles: Educación Superior Pregrado
Tipos de Horario: Teoría

Esta asignatura presenta al estudiante una introducción a los aspectos más relevantes del procesamiento de voz y audio, con especial énfasis en implementaciones HW que operen en tiempo real.
Tradicionalmente, el procesamiento de voz ha sido una de las principales áreas de aplicación del procesamiento digital de señales, y los desarrollos recientes como las interfaces de voz para asistentes digitales (las cuales requieren reconocimiento, interpretación y síntesis de voz) indican que este campo seguirá siendo relevante en el futuro previsible. El objetivo de este curso es proveer a los estudiantes tanto con los detalles técnicos de temas de común aplicación como predicción lineal, coeficientes cepstrales de Mel, mezclas de Gaussianas y modelos ocultos de Markov, así como con las herramientas para entender su aplicación a la señal de voz y una comprensión avanzada de las características de la voz como señal.
Los contenidos del curso intentan balancear la presentación de conceptos teóricos con ejemplos relevantes de implementación práctica, tanto en software (principalmente Matlab, C y Python) como en hardware (DSP, MCUs modernos). Los estudiantes deben trabajar en laboratorios que los enfrentan a problemas de implementación que normalmente no se pueden apreciar sólo desde una presentación magistral, especialmente en lo relacionado con tiempo real y precisión aritmética finita. Los estudiantes trabajarán en proyectos de clase donde deberán implementar sistemas de procesamiento de voz.


3. JUSTIFICACION

Los avances en capacidad de cómputo y conectividad disponibles para usuarios finales, así como en técnicas de procesamiento de señal e inteligencia artificial, han causado un creciente interés académico y comercial en el desarrollo de sistemas de interfaz humano-computadora basados en voz. Hoy en día se dispone ya de ejemplos comerciales de estos sistemas, como Apple’s Siri, Google assistant y Amazon’ s Alexa, y se espera que en el futuro cercano surjan y maduren muchas aplicaciones entorno a ellos. Por lo anterior, surge la necesidad de contar con personal capacitado en los aspectos teóricos y prácticos detrás de este tipo de sistemas.


4. OBJETIVOS

Brindar al estudiante las herramientas básicas necesarias para representar, analizar, diseñar e implementar sistemas de procesamiento de voz y audio.

COMPETENCIAS A DESARROLLAR EN EL CURSO

(c) Habilidad para diseñar sistemas, componentes o procesos que cumplen con necesidades planteadas y satisfaciendo restricciones reales de tipo económico, ambiental, social, político, étnico, de salubridad y seguridad, manufacturabilidad y sostenibilidad.


5. RESULTADOS DE APRENDIZAJE DEL CURSO

El estudiante estará en capacidad de:
1. Explicar el proceso general de producción de voz y su modelo desde el punto de vista del procesamiento digital de señales.
2. Explicar la operación general del sistema auditivo humano.
3. Identificar y describir las características de la voz más utilizadas en sistemas de procesamiento digital.
4. Identificar y describir los conceptos de reconocimiento de patrones y aprendizaje máquina más utilizados en el procesamiento de voz y audio.
5. Diseñar y realizar sistemas básicos de procesamiento de voz y audio en tiempo real.


6. METODOLOGIA

El desarrollo de las partes teóricas de la asignatura se lleva a cabo en su mayoría mediante exposiciones magistrales por parte del profesor abarcando los temas propuestos en el programa. Se buscará una participación más activa de los estudiantes mediante preguntas, discusión abierta y actividades alternativas de enseñanza para temas específicos seleccionados por el profesor. Para el componente práctico se asignarán trabajos de consulta sobre diferentes temas y talleres de solución de ejercicios.
Igualmente se desarrollarán laboratorios bajo el esquema de trabajo independiente, donde el estudiante tendrá que desarrollar y sustentar la realización de trabajos prácticos. Los estudiantes realizan prácticas de acuerdo con las guías entregadas por el profesor.


7. MEDIOS

Adicionalmente a los recursos tradicionales de clase, se recurre a la utilización de medios audiovisuales, equipos y dispositivos del laboratorio, así como software especializado dispuestos para tal fin. Se recurre además a las tecnologías informáticas enfocadas al apoyo del proceso de enseñanza de aprendizaje, tales como búsquedas en bases de datos e Internet, catálogo WEB y otras.


8 PRE-REQUISITOS POR TÓPICOS

8.1 Señales y sistemas
8.2 Dispositivos y circuitos electrónicos básicos.


9. CONTENIDO

TÓPICO No DE HORAS
Teóricas Prácticas
1. Introducción al procesamiento de voz y sus aplicaciones
- Anatomía y fisiología de la voz humana
- Sistema auditivo humano
6
2. Modelamiento de voz para procesamiento de señales
- Análisis de la voz usando predicción lineal
- Extracción de características de la voz
6
2
3. Codificación de voz
5
3
4. Reconocimiento automático de voz (ASR en inglés)
- Comparación de plantillas
- Agrupamiento y modelos de mezcla de Gaussianas
- Modelos ocultos de Markov
5
4
5. Síntesis de voz
- Pronunciación y prosodia
- Construcción de voces
5
3
6. Conversión de voz
3
2


10. USO DEL COMPUTADOR

Se usará el computador con programas especializados, por ejemplo Matlab, para ilustrar conceptos vistos en clase, así como para realizar implementaciones de sistemas sencillos de procesamiento de voz y audio que operen en tiempo real.


11. CONTENIDO POR CATEGORÍAS

Ciencias de la Ingeniería 70%
Diseño de Ingeniería 30%


12. DESARROLLO ESTUDIANTIL

TRABAJOS Y PROYECTOS
Los estudiantes deben desarrollar un proyecto final en grupos, asignado por el profesor. (L2, L3).


13. EVALUACIONES

Las evaluaciones corresponderán con diferentes métodos aplicados en el desarrollo de la asignatura. Se establecen los siguientes porcentajes generales aunque el profesor podrá acordar con los estudiantes la inclusión de otras notas como exámenes cortos, exposiciones y otros ítems en cada nota.

Ítems Porcentaje
Examen parcial (M) 25%
Avance del proyecto (M) 15%
Proyecto Final (F) 60%


14. BIBLIOGRAFÍA

REFERENCIAS
- Speech and Audio Signal Processing: Processing and perception of speech and music. Ben Gold &
Nelson Morgan, Wiley 2000
- Discrete time Speech Signal Processing. Thomas Quatieri, Prentice Hall 2001.
- Digital Signal Processing of Speech Signals. Lawrence Rabiner & Ronald Schafer, Prentice Hall
1978.
- Fundamentals of Speech Recognition. Lawrence Rabiner & Biing-Hwang Juang, Prentice Hall
1993.
14.2 MEDIOS ELECTRÓNICOS EN INTERNET
Base de datos IEEE (Institute of Electrical and Electronics Engineers)

Regresar a Anterior Nueva búsqueda
Imagen transparente
Versión: 8.7.2 [BSC: 8.10]