Une interface utilisateur vocale ou IUV (ou VUI pour Vocal User Interface en anglais) permet l'interaction orale entre les humains et les ordinateurs. Un dispositif de commande vocale (ou VCD pour Voice Command Device) est un appareil doté d'une interface utilisateur vocale. Les ordinateurs équipés d'un tel dispositif utilisent généralement la reconnaissance vocale pour comprendre les mots énoncés par les humains et la synthèse vocale pour les retranscrire.
Des interfaces utilisateur vocales sont intégrées aux objets du quotidien comme les automobiles, la domotique, les systèmes d'exploitation des ordinateurs, les appareils ménagers (machines à laver et les fours à micro-ondes) ou encore les télécommandes des télévisions. Elles constituent le principal moyen d'interaction avec les assistants virtuels sur les smartphones et les enceintes connectées.
Les anciens assistants automatiques (qui acheminent les appels téléphoniques vers le bon numéro) et les systèmes de réponse vocale interactive (qui effectuent des transactions plus complexes par téléphone) peuvent répondre à la pression des touches du clavier par des tonalités multifréquence, mais ces systèmes dotés d'une interface utilisateur entièrement vocale permettent aux appelants de formuler des demandes et des réponses sans avoir à appuyer sur aucun bouton.
Les nouveaux dispositifs de commande vocales sont indépendants du locuteur, ils peuvent donc répondre à plusieurs voix, indépendamment de l'accent ou des influences linguistiques. Ils sont également capables de répondre à plusieurs commandes à la fois, de séparer les messages vocaux et de fournir un retour d'information approprié, en imitant avec précision une conversation naturelle.