viernes, 19 de octubre de 2012

Reconocimiento automático del habla



El reconocimiento automático del habla (RAH) o reconocimiento automático de voz es una parte de la inteligencia artificial que tiene como objetivo permitir la comunicación hablada entre los seres humanos y los ordenadores.
Es una herramienta computacional capaz de procesar la señal de voz emitida por el ser humano y reconocer la información contenida en ella, convirtiéndola en texto o emitiendo órdenes.


Los sistemas de reconocimiento de voz pueden clasificarse según los siguientes criterios:
  • Entrenabilidad: determina si el sistema necesita un entrenamiento previo antes de empezar a usarse.
  • Dependencia del hablante: determina si el sistema debe entrenarse para cada usuario o es independiente del hablante.
  • Continuidad: determina si el sistema puede reconocer habla continua o el usuario debe hacer pausas entre palabra y palabra.
  • Robustez: determina si el sistema está diseñado para usarse con señales poco ruidosas o si puede funcionar aceptablemente en condiciones ruidosas.
  • Tamaño del dominio: determina si el sistema está diseñado para reconocer lenguaje de un dominio reducido o extenso.

Aunque cualquier tarea en la que se interactúe con un ordenador puede utilizar el reconocimiento de voz, las siguientes aplicaciones son las más comunes:
  • Dictado automático: El dictado automático es el uso más común de las tecnologías de reconocimiento de voz. En algunos casos, como en el dictado de recetas médicas y diagnósticos o en el dictado de textos legales, se usan corpus especiales para incrementar la precisión del sistema.
  • Control por comandos: Se trata de los sistemas de reconocimiento de habla diseñados para dar órdenes a un computador (por ejemplo, «cerrar ventana»).
  • Telefonía: Algunos sistemas permiten a los usuarios ejecutar comandos mediante el habla en vez de pulsar tonos.
  • Sistemas portátiles: Los sistemas portátiles de pequeño tamaño, como los relojes o los teléfonos móviles, tienen unas restricciones muy concretas de tamaño y forma, así que el habla es una solución natural para introducir datos en estos dispositivos.
  • Sistemas diseñados para discapacitados: Los sistemas de reconocimiento de voz pueden ser útiles para personas con discapacidades que les impidan teclear con fluidez, así como para personas con problemas auditivos, que pueden usarlos para obtener texto escrito a partir de habla.


No hay comentarios:

Publicar un comentario