Revision [1344]
This is an old revision of ReconnaissanceVocale made by BenoitAudouard on 2007-05-13 22:44:38.
Ne pas hésiter à lire http://fr.wikipedia.org/wiki/Reconnaissance_vocale et http://en.wikipedia.org/wiki/Speech_recognition pour l'état de l'art actuel pour le "speech-to-text".
quelques utilisations
- ReconnaissanceVocaleEnregistrement autant vérifier sa configuration au préalable (il me manque des éléments de qualité des micros, à revoir)
- ReconnaissanceVocaleCmusphinx sphinx4 est le plus élaboré à ce que je lis partout, cela fonctionne correctement en anglais
- ReconnaissanceVocalePraat praat (GPL) enregistrement/traitement des sons, reconnaissances de phonèmes
- ReconnaissanceVocaleJulius utilisation de julius (enregistrement déjà) et une reconnaissance qui fonctionne à peu près
Liens intéressants
http://wiki.eagle-usb.org/wakka.php?wiki=ReconnaissanceVocale [fr] mes prises de notes précédentes, liens vers articles sur le sujet de la reconnaissance vocale et quelques autres utilisationscvoicecontrol
http://www.kiecza.net/daniel/linux/cvoicecontrol/index.html [en] présentation et utilisation de cvoicecontrol pour de la reconnaissance vocale mono-locuteurhttp://innovexpo.itee.uq.edu.au/2002/projects/s355665/thesis.pdf [en] une thèse présentant l'utilisation de cvoicecontrol et festival pour du chat bluetooth par téléphone
praat
http://www.fon.hum.uva.nl/praat/ [en] enregistrement / traitement des sons avec praat (GPL)http://www.fon.hum.uva.nl/praat/download_sources.html téléchargement
http://pierrou.free.fr/indexpraat.htm [fr] tutoriel
cmusphinx
http://cmusphinx.sourceforge.net/html/cmusphinx.php [en]http://brewer123.home.comcast.net/projects/speechlion/ [en] Speech-controlled Desktop based on Sphinx-4
liens généraux
http://www.dev.voxforge.org/projects/Main/wiki/VoxForgeDevWikihttp://www.ece.msstate.edu/research/isip/projects/speech/index.html [en]
http://larswiki.atrc.utoronto.ca/wiki [en] Linux Accessibility Resource Site
http://freetts.sourceforge.net/demo/JSAPI/Player/README.html [en]
http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/index.html [en] spécification JSAPI
http://communicator.sourceforge.net/sites/MITRE/distributions/OSTK-20021004/sr/JSAPISpeech/doc/index.html [en] wrapper JSAPI
http://freetts.sourceforge.net/docs/index.php [en] FreeTTS et utiliser sa propre voix grâce aux outils de festvox
http://wiki.tuxisalive.com/index.php/Speech_recognition [en] essais similaires
http://cpk.auc.dk/~tb/speech/ [en] ressources disponibles au cpk (HTK , programmes, ...)
http://www.limsi.fr/Individu/barras/publis/jep96mjc.ps.gz [fr] D-DAL : UN SYSTEME DE DICTEE VOCALE DEVELOPPE SOUS L'ENVIRONNEMENT HTK Le but de cet article est de présenter les différents principes et techniques qui permettent l'implémentation d'un système de dictée vocale, à moyen vocabulaire (quelques dizaines de milliers de mots), fondé sur les modèles de Markov cachés.
http://mambo.ucsc.edu/psl/speech.html [en] beaucoup de liens sur la parole
http://fr.wikipedia.org/wiki/Reconnaissance_vocale
http://www.tsi.enst.fr/~cfaure/intro/Intro4.html [fr] cours Brève introduction à la Reconnaissance des Formes
http://r.battault.free.fr/probatoire/probatoire.html [fr] Sujet 1998 : La reconnaissance vocale, techniques utilisées, applications actuelles et futures.
http://julien.pinquier.free.fr/These/these/these.html [fr] Indexation sonore : recherche de composantes primaires pour une structuration audiovisuelle
http://sourceforge.net/projects/voxforge
http://brewer123.home.comcast.net/projects/speechlion/ [en] Speech-controlled Desktop based on Sphinx-4 (java, GPL)
http://noel.feld.cvut.cz/speechlab/start.php?page=download&lang=en [en] Speech Processing Group (czech)
http://www.irisa.fr/metiss/guig/spro/ [en] (GPL) SPro free speech signal processing toolkit which provides runtime commands implementing standard feature extraction algorithms for speech related applications
http://www-lium.univ-lemans.fr/tools/index.php?option=com_content&task=view&id=20&Itemid=38 [en] BSD/MIT The LIUM Speech Project has developed some tools and resources in order to implement an entire automatic speech recognition (ASR) system.
CategoryLangFr CategoryHobby