Reconnaissance vocale

Cette page est consacrée à la reconnaissance vocale sous Ubuntu et plus généralement sous Linux.

Canonical prévoit d'intégrer prochainement le logiciel libre speechcontrol pour ubuntu linux, développé par canonical, et pourrait faire à l'avenir de la synthèse vocale également.

KDE intègre un module de reconnaissance vocale, basique et simple à utiliser, basé sur CMU Sphinx.

Enfin, pour aider l'amélioration des modèles libres de reconnaissance vocale pour Linux, consultez le site Voxforge.org. Vous pouvez y enregistrer un texte qui permettra d'intégrer votre voix dans les modèles de reconnaissance vocale, et ainsi les améliorer.

La synthèse vocale, qui n'est pas à confondre avec la reconnaissance vocale, peut aussi vous intéresser.

Logiciels de reconnaissance vocale

  • CMU Sphinx : Sphinx est une bibliothèque écrite en java et a une variante en C
  • Perlbox : permet de commander l'environnement KDE par la voix. Basé sur Sphinx.
  • Simon : permet de contrôler de multiples applications (firefox, rhythmbox, …) ainsi que le bureau aisément. Disponible http://sourceforge.net/projects/speech2text/
  • X voice : utilise une librairie ViaVoice d'IBM qui est payante.
  • VoiceExecute : permet de lancer des logiciels par la voix
  • Dragon Naturally Speaking : fonctionne moyennement sous Wine, il permet de dicter dans NotePad par exemple. Il peut aussi être utilisé grâce à l'interface Platypus.
  • Google search sous Chrome : le moteur de recherche Google intègre désormais un bouton pour faire une recherche vocale sous Chrome.
  • Kalliope est un assistant personnel intelligent basé sur la parole avec une personalisation à l'aide de script (Supporte le français et l'anglais)
  • Lucida est un assistant personnel intelligent basé sur la parole et la vision inspiré par Sirius. Visitez le site Web pour le tutoriel, et Lucida-users pour de l'aide. Le projet est publié sous licence BSD, sauf pour certains sous-modules qui contiennent leurs propres licence.

Logiciels dont le développement est arrêté :

  • CVoiceControl : n'est plus soutenu par son créateur depuis 2002
  • gnome-voice-control : permet de contrôler l'environnement GNOME par la voix. N'est plus dans les dépôts d'Ubuntu depuis 12.04.
  • Google2Ubuntu: utilise la reconnaissance vocale de Google. Arreté en 2014 depuis que Google a changé son API et demande désormais une clef

Voir aussi

Pages en rapport