Revision [1343]

This is an old revision of ReconnaissanceVocale made by BenoitAudouard on 2007-05-13 22:43:18.

 

La reconnaissance de la parole a beaucoup évolué depuis que j'en faisais sur mon Apple IIe en monolocuteur (autour de 1985). Maintenant le multi-locuteur avec vocabulaire limité est correctement possible (et déjà utilisé par exemple dans les messageries vocales).
Ne pas hésiter à lire http://fr.wikipedia.org/wiki/Reconnaissance_vocale et http://en.wikipedia.org/wiki/Speech_recognition pour l'état de l'art actuel pour le "speech-to-text".

quelques utilisations


Liens intéressants

http://wiki.eagle-usb.org/wakka.php?wiki=ReconnaissanceVocale [fr] mes prises de notes précédentes, liens vers articles sur le sujet de la reconnaissance vocale et quelques autres utilisations
cvoicecontrol
http://www.kiecza.net/daniel/linux/cvoicecontrol/index.html [en] présentation et utilisation de cvoicecontrol pour de la reconnaissance vocale mono-locuteur
http://innovexpo.itee.uq.edu.au/2002/projects/s355665/thesis.pdf [en] une thèse présentant l'utilisation de cvoicecontrol et festival pour du chat bluetooth par téléphone
praat
http://www.fon.hum.uva.nl/praat/ [en] enregistrement / traitement des sons avec praat (GPL)
http://www.fon.hum.uva.nl/praat/download_sources.html téléchargement
http://pierrou.free.fr/indexpraat.htm [fr] tutoriel
cmusphinx
http://cmusphinx.sourceforge.net/html/cmusphinx.php [en]
http://brewer123.home.comcast.net/projects/speechlion/ [en] Speech-controlled Desktop based on Sphinx-4

liens généraux
http://www.dev.voxforge.org/projects/Main/wiki/VoxForgeDevWiki
http://www.ece.msstate.edu/research/isip/projects/speech/index.html [en]
http://larswiki.atrc.utoronto.ca/wiki [en] Linux Accessibility Resource Site
http://freetts.sourceforge.net/demo/JSAPI/Player/README.html [en]
http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/index.html [en] spécification JSAPI
http://communicator.sourceforge.net/sites/MITRE/distributions/OSTK-20021004/sr/JSAPISpeech/doc/index.html [en] wrapper JSAPI
http://freetts.sourceforge.net/docs/index.php [en] FreeTTS et utiliser sa propre voix grâce aux outils de festvox
http://wiki.tuxisalive.com/index.php/Speech_recognition [en] essais similaires
http://cpk.auc.dk/~tb/speech/ [en] ressources disponibles au cpk (HTK , programmes, ...)
http://www.limsi.fr/Individu/barras/publis/jep96mjc.ps.gz [fr] D-DAL : UN SYSTEME DE DICTEE VOCALE DEVELOPPE SOUS L'ENVIRONNEMENT HTK Le but de cet article est de présenter les différents principes et techniques qui permettent l'implémentation d'un système de dictée vocale, à moyen vocabulaire (quelques dizaines de milliers de mots), fondé sur les modèles de Markov cachés.
http://mambo.ucsc.edu/psl/speech.html [en] beaucoup de liens sur la parole
http://fr.wikipedia.org/wiki/Reconnaissance_vocale
http://www.tsi.enst.fr/~cfaure/intro/Intro4.html [fr] cours Brève introduction à la Reconnaissance des Formes
http://r.battault.free.fr/probatoire/probatoire.html [fr] Sujet 1998 : La reconnaissance vocale, techniques utilisées, applications actuelles et futures.
http://julien.pinquier.free.fr/These/these/these.html [fr] Indexation sonore : recherche de composantes primaires pour une structuration audiovisuelle
http://sourceforge.net/projects/voxforge
http://brewer123.home.comcast.net/projects/speechlion/ [en] Speech-controlled Desktop based on Sphinx-4 (java, GPL)
http://noel.feld.cvut.cz/speechlab/start.php?page=download&lang=en [en] Speech Processing Group (czech)
http://www.irisa.fr/metiss/guig/spro/ [en] (GPL) SPro free speech signal processing toolkit which provides runtime commands implementing standard feature extraction algorithms for speech related applications
http://www-lium.univ-lemans.fr/tools/index.php?option=com_content&task=view&id=20&Itemid=38 [en] BSD/MIT The LIUM Speech Project has developed some tools and resources in order to implement an entire automatic speech recognition (ASR) system.

CategoryLangFr CategoryHobby
Valid XHTML :: Valid CSS: :: Powered by WikkaWiki