Reconnaissance vocal

Résolu
tagboys Messages postés 42 Date d'inscription lundi 28 avril 2003 Statut Membre Dernière intervention 28 mars 2014 - 30 août 2004 à 21:37
cs_mimaaaa Messages postés 2 Date d'inscription samedi 11 août 2007 Statut Membre Dernière intervention 6 août 2008 - 6 août 2008 à 11:44
Bon j'orait besoin d'un peut d'aide par raport a la reconnaisance vocal.
en breff je veut comparer la voix d'une personne (mp3) a celle d'un micro . je sais que la meilleur facon serait par les bytes les comparer .... mais pour comparer sa serait mieux de decompresser le mp3 ses la ou qu'il y a le ik.
comparer les sequences a la voix devrais surement prendre une API ms agent (windows) si quelqu'un a deja tente un tel projet il serait aimable de me donner un ptit coup de pouce
merci

20 réponses

essirc Messages postés 48 Date d'inscription vendredi 23 juillet 2004 Statut Membre Dernière intervention 26 juillet 2005 3
31 août 2004 à 00:44
Alors la SpeechAPI est faite pour toi :) En plus y a de bons exemples livrés avec.

Tu verras c'est pas très compliqué, il suffit juste de faire un petit fichier XML avec les commandes à reconnaitre (ex : ouvrir, fermer, quitter...). Et l'API te renverra des tokens en fonction de ce qui a été reconnu. Tu auras juste à les traiter dans un switch et à effectuer les actions nécessaires.
4
glipper Messages postés 246 Date d'inscription dimanche 2 juin 2002 Statut Membre Dernière intervention 11 septembre 2016 1
30 août 2004 à 22:55
Ouh la la la la à mon avis c'est pas si simple....
Glipper
0
essirc Messages postés 48 Date d'inscription vendredi 23 juillet 2004 Statut Membre Dernière intervention 26 juillet 2005 3
31 août 2004 à 00:20
Je crois que glipper a raison, la reconnaissance vocale ne se limite pas à une comparaison d'octets entre deux flux audio. Pour ce qui est de l'API, MSAgent se contente d'effectuer une synthèse vocale, pour la reconnaissance il faut utiliser la SpeechAPI (SAPI). Cette API offre deux modes de fonctionnement : la reconnaissance de commande et la dictée.

Si ton application se limite à une reconnaissance de commande je peux te fournir quelques exemples de programmes pour démarrer.

Bon courage.
0
tagboys Messages postés 42 Date d'inscription lundi 28 avril 2003 Statut Membre Dernière intervention 28 mars 2014
31 août 2004 à 00:32
Oui effectivement essirc "SpeechAPI" j'ai deja entendu parler mais pas plus qui faut , sa serait plus la reconnaisance de commande j'ai l'intention de faire (les racourcis clavier) en vocal.
0

Vous n’avez pas trouvé la réponse que vous recherchez ?

Posez votre question
tagboys Messages postés 42 Date d'inscription lundi 28 avril 2003 Statut Membre Dernière intervention 28 mars 2014
31 août 2004 à 01:29
oki merci :) mais les programme peut tu me donner leur lien.

puis SpeechAPI ou que je pourait aprendre a l'utiliser
0
essirc Messages postés 48 Date d'inscription vendredi 23 juillet 2004 Statut Membre Dernière intervention 26 juillet 2005 3
31 août 2004 à 01:44
Voici un lien vers un tutoriel qui décrit les différentes étapes de la conception d'un petit programme de dessin commandé par la voix (en utilisant la SAPI de M$).

http://www.generation5.org/content/2001/sr00.asp
0
magic_Nono Messages postés 1878 Date d'inscription jeudi 16 octobre 2003 Statut Membre Dernière intervention 16 mars 2011
31 août 2004 à 09:53
mieux vau utiliser des bibli existantes, ton pb fait parti de la reconnaissance des formes qui est l'un des plus gros pb de prog....

++

Magic Nono: l'informagicien! 8-)
0
DevGizmo Messages postés 122 Date d'inscription lundi 16 décembre 2002 Statut Membre Dernière intervention 27 février 2007 1
31 août 2004 à 13:11
magic_Nono> reconnaissance de formes != reconnaissance vocale

par contre effectivement le probleme peut se resoudre a l'aide de reseau de neuronnes....bref un truc "imbitable" pour chercheur...
0
magic_Nono Messages postés 1878 Date d'inscription jeudi 16 octobre 2003 Statut Membre Dernière intervention 16 mars 2011
31 août 2004 à 14:06
le son = une forme,

si si

dslé Gizmo

Magic Nono: l'informagicien! 8-)
0
magic_Nono Messages postés 1878 Date d'inscription jeudi 16 octobre 2003 Statut Membre Dernière intervention 16 mars 2011
31 août 2004 à 14:07
résol effectivt avec RNA & algo génétiques

C + drole

Magic Nono: l'informagicien! 8-)
0
DevGizmo Messages postés 122 Date d'inscription lundi 16 décembre 2002 Statut Membre Dernière intervention 27 février 2007 1
31 août 2004 à 15:51
Je suis pas tellement d'accord avec ce que tu dis: je m'explique:
effectivement et naivement on peut penser que la reconnaissance entre deux signaux peut se faire en regardant les min max et autres parametres de la "forme" du signal...mais cela ne s'arrete et ne commence pas par la...
Imagine que tu enregistre ta voix avec un micro et que tu veux la comparer a un autre signal de maniere a "voir" si c'est la meme chose de maniere a declencher une serie de traitement. Quand la voix est enregistree ce sera avec l'accent, la voix en elle meme (homme/femme:grave/un peu plus aigu), le bruit autour de la personne qui s'enregistre => plein de parametres qui vont faire que le signal ne sera pas comparable directement ou meme indirectement; je pense donc que ce n'est pas de la reconnaissance de forme...
0
tagboys Messages postés 42 Date d'inscription lundi 28 avril 2003 Statut Membre Dernière intervention 28 mars 2014
31 août 2004 à 17:22
Merci essirc pour le tuto sa va me donner une bonne parti :)
mais j'y vais pour la reconnaissance vocal ou reconnaissance de formes
0
magic_Nono Messages postés 1878 Date d'inscription jeudi 16 octobre 2003 Statut Membre Dernière intervention 16 mars 2011
31 août 2004 à 18:26
totalement d'ac avec toi

mais regarde les labos de recherches, la reco vocale est tjs ds les labos RF.

Bref, ce n'est qu'une guerre de terme et C stérile.
En tt cas... utilise des bibli préexistantes puis si sa t'amuse, fait les évoluer....
les rech sont tjs en cours alors...
tu peux contribuer
mé sois vraiement callé qd tu t'y lancera
++

Magic Nono: l'informagicien! 8-)
0
tagboys Messages postés 42 Date d'inscription lundi 28 avril 2003 Statut Membre Dernière intervention 28 mars 2014
31 août 2004 à 19:05
merci du conseille nous sommes 4 qui travaille sur se projets allors nous allons surement aboutir a quelque chose
0
cs_jeron Messages postés 29 Date d'inscription lundi 30 juin 2003 Statut Membre Dernière intervention 25 juillet 2014 2
6 oct. 2006 à 23:50
cela marche t'il avec devcpp ou aut il faire comme d'habitude avec un projet MVisual studio ?
0
cs_jeron Messages postés 29 Date d'inscription lundi 30 juin 2003 Statut Membre Dernière intervention 25 juillet 2014 2
6 oct. 2006 à 23:56
bon alors c'est non.il faut installer leprogramme et se debrouiller avec le c++ et xml.bon courage a tous les passionés comme moi
0
Yuudo Messages postés 2 Date d'inscription mercredi 17 janvier 2007 Statut Membre Dernière intervention 5 août 2008
18 janv. 2007 à 20:45
Bonjour,
Je ne sais pas ou poster ma demande...excusez-moi à l' avance si ce n'est pas l'endroit.

Je suis à la recherche de conseils et de développeurs passionnés pour monter un petit groupe de travail et de recherche autour de l’environnement Client/serveur et la reconnaissance et synthèse vocale dans un environnement Apache/Tomcat, PHP, MySQL, JAVA. Notre objectif est de développer une petite application innovante et passionnante pour permettre de faire une démonstration et montrer les possibilités que peuvent offrir les technologies actuelles. L'idée (tres simplifier du projet) est de passer des requettes SQL entre un poste client et un serveur web grace à la voix. La reponse de cette requette est effectue en synthese vocale sur le poste client.

Si ce projet vous interesse et que vous souhaitez en savoir plus je serai ravi de vous en parler.

merci pour vos reponses et votre aide....
Lionel.
0
cs_mimaaaa Messages postés 2 Date d'inscription samedi 11 août 2007 Statut Membre Dernière intervention 6 août 2008
5 août 2008 à 18:01
Bonjour,
je sais que mon poste est en retard masi bon, je tente ma chance.
Je suis en stage et j'ai comme mission de réaliser une aplication de reconnaissance vocale, l'utilisateur doit passer une commande vocale et auserveur de l'executer.
là je suis étourdie, si vous avez des pistes à me donner.
Merci pour votre aide.
0
Yuudo Messages postés 2 Date d'inscription mercredi 17 janvier 2007 Statut Membre Dernière intervention 5 août 2008
5 août 2008 à 22:05
Bonjour,

Je viens de prendre connaissance de votre post...je vous propose de regarder ce site www.yuudo.com . Si cela vous interesse, ce personnage a besoin d'une application de reconnaissance vocale. n'hesitez pas à me contacter à travers le site du Yuudo si vous avez des questions.
0
cs_mimaaaa Messages postés 2 Date d'inscription samedi 11 août 2007 Statut Membre Dernière intervention 6 août 2008
6 août 2008 à 11:44
Merci yuudo pour ton post,


j'ai vu le lien joint, c'est interessant et original le petit bonhome de compagnie :)


moi je suis déjà engagé dans un stage, je cherche de l'aide, des exeples de routine qui peuvent m'aider à démarrer mon projet.
Au fait, l'application doit pouvoir enregistrer des sons qui sont des instructions de commande. l'enregistrement ne cause pas de probleme, avec l'api java sound c'est faisable, il faudrait ensuite qd l'utilisateur prononce un mot, il doit etre reconnu (comparé avec l'ensemble des commandes deja enregistrées) et executer l'instruction correspondante.
comment faire cela !!!! je cherche encore.
je vous remercie pour votre attention et votre aide.
0
Rejoignez-nous