Los comandos de voz sirven para controlar las aplicaciones o sistemas sin necesidad de utilizar el teclado o la pantalla. A menudo, estos sistemas de comandos de voz se llevan a cabo por medio del teléfono y permiten al usuario comunicar información o comandos directamente a través de un menú de navegación controlado por voz y sin el uso de otros recursos. Estos sistemas también se denominan sistemas IVR (sistemas de respuesta de voz interactiva). El control de los comandos de voz puede estar automatizado total o parcialmente.
Los sistemas IVR inteligentes están constituidos por varios componentes. El componente central es el reconocimiento de voz, que en los sistemas modernos suele ser capaz de interpretar los comandos de voz exactamente en términos de gramática y semántica. Junto al reconocimiento de voz es necesario interpretar el diálogo mediante el procesamiento electrónico de datos (PED), para así convertir los comandos de voz en ordenes que pueda reconocer un ordenador. Para interpretar los comandos de voz se dispone de funciones de síntesis text-to-speech. Estas convierten los textos comunicados en información de voz por medio de voces generadas por ordenador. En la base, una aplicación con la lógica de PED necesaria se ocupa de la integración de los datos y los procesos de los comandos de voz.
Los sistemas de comandos de voz permiten una comunicación natural y directa con los sistemas informáticos sin necesidad de usar las manos ni mirar una pantalla. De esta forma se puede evitar el uso de complicadas interfaces de usuario y comandos crípticos. Una ventaja adicional son los bajos requerimientos en el terminal del usuario. Por lo general, es suficiente con un teléfono convencional sin ningún tipo de funciones adicionales. Además, los sistemas de control por voz se pueden configurar para que funcionen en múltiples idiomas y entiendan así a diferentes usuarios.
Los sistemas de comandos de voz se utilizan a menudo en los centros de llamadas para aceptar las llamadas y pre-clasificar los motivos de consulta de las personas que llaman. Las centrales de notificación de los fallos de las grandes empresas suelen disponer de un sistema de comandos de voz. Por ejemplo, por medio de comandos de voz se puede obtener más información acerca del motivo de la llamada, con el fin de transferirla posteriormente a los empleados del departamento más adecuado. Mediante simples preguntas a las que hay que responder “sí” o “no”, se guía a la persona con precisión a través de un árbol de selección predefinido.