tagboys
Messages postés42Date d'inscriptionlundi 28 avril 2003StatutMembreDernière intervention28 mars 2014
-
30 août 2004 à 21:37
cs_mimaaaa
Messages postés2Date d'inscriptionsamedi 11 août 2007StatutMembreDernière intervention 6 août 2008
-
6 août 2008 à 11:44
Bon j'orait besoin d'un peut d'aide par raport a la reconnaisance vocal.
en breff je veut comparer la voix d'une personne (mp3) a celle d'un micro . je sais que la meilleur facon serait par les bytes les comparer .... mais pour comparer sa serait mieux de decompresser le mp3 ses la ou qu'il y a le ik.
comparer les sequences a la voix devrais surement prendre une API ms agent (windows) si quelqu'un a deja tente un tel projet il serait aimable de me donner un ptit coup de pouce
merci
essirc
Messages postés48Date d'inscriptionvendredi 23 juillet 2004StatutMembreDernière intervention26 juillet 20053 31 août 2004 à 00:44
Alors la SpeechAPI est faite pour toi :) En plus y a de bons exemples livrés avec.
Tu verras c'est pas très compliqué, il suffit juste de faire un petit fichier XML avec les commandes à reconnaitre (ex : ouvrir, fermer, quitter...). Et l'API te renverra des tokens en fonction de ce qui a été reconnu. Tu auras juste à les traiter dans un switch et à effectuer les actions nécessaires.
essirc
Messages postés48Date d'inscriptionvendredi 23 juillet 2004StatutMembreDernière intervention26 juillet 20053 31 août 2004 à 00:20
Je crois que glipper a raison, la reconnaissance vocale ne se limite pas à une comparaison d'octets entre deux flux audio. Pour ce qui est de l'API, MSAgent se contente d'effectuer une synthèse vocale, pour la reconnaissance il faut utiliser la SpeechAPI (SAPI). Cette API offre deux modes de fonctionnement : la reconnaissance de commande et la dictée.
Si ton application se limite à une reconnaissance de commande je peux te fournir quelques exemples de programmes pour démarrer.
tagboys
Messages postés42Date d'inscriptionlundi 28 avril 2003StatutMembreDernière intervention28 mars 2014 31 août 2004 à 00:32
Oui effectivement essirc "SpeechAPI" j'ai deja entendu parler mais pas plus qui faut , sa serait plus la reconnaisance de commande j'ai l'intention de faire (les racourcis clavier) en vocal.
Vous n’avez pas trouvé la réponse que vous recherchez ?
essirc
Messages postés48Date d'inscriptionvendredi 23 juillet 2004StatutMembreDernière intervention26 juillet 20053 31 août 2004 à 01:44
Voici un lien vers un tutoriel qui décrit les différentes étapes de la conception d'un petit programme de dessin commandé par la voix (en utilisant la SAPI de M$).
DevGizmo
Messages postés122Date d'inscriptionlundi 16 décembre 2002StatutMembreDernière intervention27 février 20071 31 août 2004 à 15:51
Je suis pas tellement d'accord avec ce que tu dis: je m'explique:
effectivement et naivement on peut penser que la reconnaissance entre deux signaux peut se faire en regardant les min max et autres parametres de la "forme" du signal...mais cela ne s'arrete et ne commence pas par la...
Imagine que tu enregistre ta voix avec un micro et que tu veux la comparer a un autre signal de maniere a "voir" si c'est la meme chose de maniere a declencher une serie de traitement. Quand la voix est enregistree ce sera avec l'accent, la voix en elle meme (homme/femme:grave/un peu plus aigu), le bruit autour de la personne qui s'enregistre => plein de parametres qui vont faire que le signal ne sera pas comparable directement ou meme indirectement; je pense donc que ce n'est pas de la reconnaissance de forme...
magic_Nono
Messages postés1878Date d'inscriptionjeudi 16 octobre 2003StatutMembreDernière intervention16 mars 2011 31 août 2004 à 18:26
totalement d'ac avec toi
mais regarde les labos de recherches, la reco vocale est tjs ds les labos RF.
Bref, ce n'est qu'une guerre de terme et C stérile.
En tt cas... utilise des bibli préexistantes puis si sa t'amuse, fait les évoluer....
les rech sont tjs en cours alors...
tu peux contribuer
mé sois vraiement callé qd tu t'y lancera
++
Yuudo
Messages postés2Date d'inscriptionmercredi 17 janvier 2007StatutMembreDernière intervention 5 août 2008 18 janv. 2007 à 20:45
Bonjour,
Je ne sais pas ou poster ma demande...excusez-moi à l' avance si ce n'est pas l'endroit.
Je suis à la recherche de conseils et de développeurs passionnés pour monter un petit groupe de travail et de recherche autour de l’environnement Client/serveur et la reconnaissance et synthèse vocale dans un environnement Apache/Tomcat, PHP, MySQL, JAVA. Notre objectif est de développer une petite application innovante et passionnante pour permettre de faire une démonstration et montrer les possibilités que peuvent offrir les technologies actuelles. L'idée (tres simplifier du projet) est de passer des requettes SQL entre un poste client et un serveur web grace à la voix. La reponse de cette requette est effectue en synthese vocale sur le poste client.
Si ce projet vous interesse et que vous souhaitez en savoir plus je serai ravi de vous en parler.
cs_mimaaaa
Messages postés2Date d'inscriptionsamedi 11 août 2007StatutMembreDernière intervention 6 août 2008 5 août 2008 à 18:01
Bonjour,
je sais que mon poste est en retard masi bon, je tente ma chance.
Je suis en stage et j'ai comme mission de réaliser une aplication de reconnaissance vocale, l'utilisateur doit passer une commande vocale et auserveur de l'executer.
là je suis étourdie, si vous avez des pistes à me donner.
Merci pour votre aide.
Yuudo
Messages postés2Date d'inscriptionmercredi 17 janvier 2007StatutMembreDernière intervention 5 août 2008 5 août 2008 à 22:05
Bonjour,
Je viens de prendre connaissance de votre post...je vous propose de regarder ce site www.yuudo.com . Si cela vous interesse, ce personnage a besoin d'une application de reconnaissance vocale. n'hesitez pas à me contacter à travers le site du Yuudo si vous avez des questions.
cs_mimaaaa
Messages postés2Date d'inscriptionsamedi 11 août 2007StatutMembreDernière intervention 6 août 2008 6 août 2008 à 11:44
Merci yuudo pour ton post,
j'ai vu le lien joint, c'est interessant et original le petit bonhome de compagnie :)
moi je suis déjà engagé dans un stage, je cherche de l'aide, des exeples de routine qui peuvent m'aider à démarrer mon projet.
Au fait, l'application doit pouvoir enregistrer des sons qui sont des instructions de commande. l'enregistrement ne cause pas de probleme, avec l'api java sound c'est faisable, il faudrait ensuite qd l'utilisateur prononce un mot, il doit etre reconnu (comparé avec l'ensemble des commandes deja enregistrées) et executer l'instruction correspondante.
comment faire cela !!!! je cherche encore.
je vous remercie pour votre attention et votre aide.