Científicos de la UGR son premiados por una investigación sobre reconocimiento de voz en móviles de alta gama

Los investigadores, pertenecientes al grupo SigMAT, han recibido el premio al mejor artículo firmado por un estudiante de doctorado como primer autor en el prestigioso congreso internacional "European Signal Processing Conference"

científicos|ugr — Uno de los investigadores de la UGR

25/09/2014 11:21

Manrique Pascual

Investigadores del grupo de investigación SigMAT (Signal Processing, Multimedia Transmission and Speech/Audio Technologies) de la Universidad de Granada han sido recientemente premiados con el "Best Student Paper Award" en el prestigioso congreso internacional "European Signal Processing Conference" (EUSIPCO'14, http://www.eusipco2014.org/awards/best-student-paper-awards/), celebrado en Lisboa. Este reconocimiento es otorgado al mejor artículo firmado por un estudiante de doctorado como primer autor.

El artículo premiado se titula Feature Enhancement for Robust Speech Recognition on Smartphones with Dual-Microphone y sus autores son Iván López Espejo (estudiante de doctorado de la UGR), Ángel M. Gómez García (profesor de la UGR), José A. González López (investigador de la Universidad de Sheffield, UK) y Antonio M. Peinado Herreros (catedrático de la Universidad de Granada y coordinador de SigMAT).

El artículo trata sobre cómo obtener un reconocimiento de voz de muy alta calidad en móviles de gama alta equipados con dos micrófonos. Cada vez son más los usuarios que usan los diversos servicios disponibles de reconocimiento automático de voz para interactuar con su smartphone y, en particular, para dictar mensajes cortos y WhatsApps sin tener que usar el pequeño teclado de pantalla.

Uno de los principales retos tecnológicos de estos servicios es el de conseguir dispositivos capaces de proporcionar una alta precisión de reconocimiento incluso cuando se hace uso de ellos en ambientes ruidosos (calle, estaciones de autobús, aeropuertos, restaurantes, etc). Muchos nuevos smartphones incorporan un micrófono dual (pareja de micrófonos sincronizados) para mejorar la calidad de la voz transmitida.

Dos micrófonos en lugar de uno
Los autores del artículo han sido los primeros en proponer soluciones técnicas para su aprovechamiento en los servicios de reconocimiento de voz, consiguiendo mejoras muy notables respecto a otras técnicas clásicas basadas en el uso de un sólo micrófono.

Los investigadores del grupo SigMAT (http://ceres.ugr.es/sigmat/) tienen una experiencia de más de 15 años en el campo del reconocimiento automático de voz para móviles, tema sobre el que han publicado numerosos artículos en prestigiosas revistas como los Transactions del IEEE y un libro específico para la editorial Wiley & Sons(http://eu.wiley.com/WileyCDA/WileyTitle/productCd-0470024003.html).

El grupo SigMAT de la UGR tiene también proyectos activos en otros temas relacionados con las tecnologías multimedia, como la mejora de la calidad de vídeo para TV en móviles o de la calidad de voz en telefonía IP, y el procesado de señal aplicado a la clasificación de proteínas o al uso de señales ultrasónicas para el testeo de materiales y para la monitorización del crecimiento de córneas artificiales.

Etiquetas Premios