Revision [1547]

This is an old revision of ReconnaissanceVocale made by BenoitAudouard on 2007-08-26 13:52:35.

 

La reconnaissance de la parole a beaucoup évolué depuis que j'en faisais sur mon Apple IIe en monolocuteur (autour de 1985). Maintenant le multi-locuteur avec vocabulaire limité est correctement possible (et déjà utilisé par exemple dans les messageries vocales).
Ne pas hésiter à lire http://fr.wikipedia.org/wiki/Reconnaissance_vocale et http://en.wikipedia.org/wiki/Speech_recognition pour l'état de l'art actuel pour le "speech-to-text".

Note : oui le titre de cette page ReconnaissanceVocale est erroné (même si les liens ci-dessous en parlent avec cvoicecontrol par exemple), quand j'aurai le courage je créerai ReconnaissanceParole

Quelques utilisations en reconnaissance de la parole

et aussi SyntheseVocaleEspeak pour ne pas me parler qu'à moi-même et commencer un dialogue ;-)

Liens intéressants

http://wiki.eagle-usb.org/wakka.php?wiki=ReconnaissanceVocale [fr] mes prises de notes précédentes, liens vers articles sur le sujet de la reconnaissance vocale et quelques autres utilisations
cvoicecontrol
http://www.kiecza.net/daniel/linux/cvoicecontrol/index.html [en] présentation et utilisation de cvoicecontrol pour de la reconnaissance vocale mono-locuteur
http://innovexpo.itee.uq.edu.au/2002/projects/s355665/thesis.pdf [en] une thèse présentant l'utilisation de cvoicecontrol et festival pour du chat bluetooth par téléphone
praat
http://www.fon.hum.uva.nl/praat/ [en] enregistrement / traitement des sons avec praat (GPL)
http://www.fon.hum.uva.nl/praat/download_sources.html téléchargement
http://pierrou.free.fr/indexpraat.htm [fr] tutoriel
cmusphinx
http://cmusphinx.sourceforge.net/html/cmusphinx.php [en]
http://brewer123.home.comcast.net/projects/speechlion/ [en] Speech-controlled Desktop based on Sphinx-4

liens généraux
http://www.dev.voxforge.org/projects/Main/wiki/VoxForgeDevWiki
http://www.ece.msstate.edu/research/isip/projects/speech/index.html [en]
http://larswiki.atrc.utoronto.ca/wiki [en] Linux Accessibility Resource Site
http://freetts.sourceforge.net/demo/JSAPI/Player/README.html [en]
http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/index.html [en] spécification JSAPI
http://communicator.sourceforge.net/sites/MITRE/distributions/OSTK-20021004/sr/JSAPISpeech/doc/index.html [en] wrapper JSAPI
http://freetts.sourceforge.net/docs/index.php [en] FreeTTS et utiliser sa propre voix grâce aux outils de festvox
http://wiki.tuxisalive.com/index.php/Speech_recognition [en] essais similaires
http://cpk.auc.dk/~tb/speech/ [en] ressources disponibles au cpk (HTK , programmes, ...)
http://www.limsi.fr/Individu/barras/publis/jep96mjc.ps.gz [fr] D-DAL : UN SYSTEME DE DICTEE VOCALE DEVELOPPE SOUS L'ENVIRONNEMENT HTK Le but de cet article est de présenter les différents principes et techniques qui permettent l'implémentation d'un système de dictée vocale, à moyen vocabulaire (quelques dizaines de milliers de mots), fondé sur les modèles de Markov cachés.
http://mambo.ucsc.edu/psl/speech.html [en] beaucoup de liens sur la parole
http://fr.wikipedia.org/wiki/Reconnaissance_vocale
http://www.tsi.enst.fr/~cfaure/intro/Intro4.html [fr] cours Brève introduction à la Reconnaissance des Formes
http://r.battault.free.fr/probatoire/probatoire.html [fr] Sujet 1998 : La reconnaissance vocale, techniques utilisées, applications actuelles et futures.
http://julien.pinquier.free.fr/These/these/these.html [fr] Indexation sonore : recherche de composantes primaires pour une structuration audiovisuelle
http://sourceforge.net/projects/voxforge
http://brewer123.home.comcast.net/projects/speechlion/ [en] Speech-controlled Desktop based on Sphinx-4 (java, GPL)
http://noel.feld.cvut.cz/speechlab/start.php?page=download&lang=en [en] Speech Processing Group (czech)
http://www.irisa.fr/metiss/guig/spro/ [en] (GPL) SPro free speech signal processing toolkit which provides runtime commands implementing standard feature extraction algorithms for speech related applications
http://www-lium.univ-lemans.fr/tools/index.php?option=com_content&task=view&id=20&Itemid=38 [en] BSD/MIT The LIUM Speech Project has developed some tools and resources in order to implement an entire automatic speech recognition (ASR) system.
http://web.archive.org/web/20040824162053/http://xvoice.arborius.net/xvoice-sphinx/RunningSphinxTrain [en] sphinx2 training for speech-dependant recognition
http://xvoice.sourceforge.net/xvoice-sphinx/ [en] xvoice était basé sur ViaVoice mais un projet avec sphinx existe aussi
http://project.uet.itgo.com/speech.htm [en] des explications claires sur la reconnaissance de la parole et la synthèse de la parole
https://linuxfr.org/2004/09/13/17194.html [fr] ces logiciels manipulent des mots, dates, heures et endroits (villes, états, ...). De plus, IBM donne des outils d'édition de la parole à la Fondation Eclipse




CategoryLangFr CategoryHobby
Valid XHTML :: Valid CSS: :: Powered by WikkaWiki