Reconnaissance vocal [Résolu]

tagboys 42 Messages postés lundi 28 avril 2003Date d'inscription 28 mars 2014 Dernière intervention - 30 août 2004 à 21:37 - Dernière réponse : cs_mimaaaa 2 Messages postés samedi 11 août 2007Date d'inscription 6 août 2008 Dernière intervention
- 6 août 2008 à 11:44
Bon j'orait besoin d'un peut d'aide par raport a la reconnaisance vocal.
en breff je veut comparer la voix d'une personne (mp3) a celle d'un micro . je sais que la meilleur facon serait par les bytes les comparer .... mais pour comparer sa serait mieux de decompresser le mp3 ses la ou qu'il y a le ik.
comparer les sequences a la voix devrais surement prendre une API ms agent (windows) si quelqu'un a deja tente un tel projet il serait aimable de me donner un ptit coup de pouce
merci
Afficher la suite 

20 réponses

Répondre au sujet
essirc 48 Messages postés vendredi 23 juillet 2004Date d'inscription 26 juillet 2005 Dernière intervention - 31 août 2004 à 00:44
+2
Utile
Alors la SpeechAPI est faite pour toi :) En plus y a de bons exemples livrés avec.

Tu verras c'est pas très compliqué, il suffit juste de faire un petit fichier XML avec les commandes à reconnaitre (ex : ouvrir, fermer, quitter...). Et l'API te renverra des tokens en fonction de ce qui a été reconnu. Tu auras juste à les traiter dans un switch et à effectuer les actions nécessaires.
Cette réponse vous a-t-elle aidé ?  
Commenter la réponse de essirc
glipper 246 Messages postés dimanche 2 juin 2002Date d'inscription 11 septembre 2016 Dernière intervention - 30 août 2004 à 22:55
0
Utile
Ouh la la la la à mon avis c'est pas si simple....
Glipper
Commenter la réponse de glipper
essirc 48 Messages postés vendredi 23 juillet 2004Date d'inscription 26 juillet 2005 Dernière intervention - 31 août 2004 à 00:20
0
Utile
Je crois que glipper a raison, la reconnaissance vocale ne se limite pas à une comparaison d'octets entre deux flux audio. Pour ce qui est de l'API, MSAgent se contente d'effectuer une synthèse vocale, pour la reconnaissance il faut utiliser la SpeechAPI (SAPI). Cette API offre deux modes de fonctionnement : la reconnaissance de commande et la dictée.

Si ton application se limite à une reconnaissance de commande je peux te fournir quelques exemples de programmes pour démarrer.

Bon courage.
Commenter la réponse de essirc
tagboys 42 Messages postés lundi 28 avril 2003Date d'inscription 28 mars 2014 Dernière intervention - 31 août 2004 à 00:32
0
Utile
Oui effectivement essirc "SpeechAPI" j'ai deja entendu parler mais pas plus qui faut , sa serait plus la reconnaisance de commande j'ai l'intention de faire (les racourcis clavier) en vocal.
Commenter la réponse de tagboys
tagboys 42 Messages postés lundi 28 avril 2003Date d'inscription 28 mars 2014 Dernière intervention - 31 août 2004 à 01:29
0
Utile
oki merci :) mais les programme peut tu me donner leur lien.

puis SpeechAPI ou que je pourait aprendre a l'utiliser
Commenter la réponse de tagboys
essirc 48 Messages postés vendredi 23 juillet 2004Date d'inscription 26 juillet 2005 Dernière intervention - 31 août 2004 à 01:44
0
Utile
Voici un lien vers un tutoriel qui décrit les différentes étapes de la conception d'un petit programme de dessin commandé par la voix (en utilisant la SAPI de M$).

http://www.generation5.org/content/2001/sr00.asp
Commenter la réponse de essirc
magic_Nono 1878 Messages postés jeudi 16 octobre 2003Date d'inscription 16 mars 2011 Dernière intervention - 31 août 2004 à 09:53
0
Utile
mieux vau utiliser des bibli existantes, ton pb fait parti de la reconnaissance des formes qui est l'un des plus gros pb de prog....

++

Magic Nono: l'informagicien! 8-)
Commenter la réponse de magic_Nono
DevGizmo 122 Messages postés lundi 16 décembre 2002Date d'inscription 27 février 2007 Dernière intervention - 31 août 2004 à 13:11
0
Utile
magic_Nono> reconnaissance de formes != reconnaissance vocale

par contre effectivement le probleme peut se resoudre a l'aide de reseau de neuronnes....bref un truc "imbitable" pour chercheur...
Commenter la réponse de DevGizmo
magic_Nono 1878 Messages postés jeudi 16 octobre 2003Date d'inscription 16 mars 2011 Dernière intervention - 31 août 2004 à 14:06
0
Utile
le son = une forme,

si si

dslé Gizmo

Magic Nono: l'informagicien! 8-)
Commenter la réponse de magic_Nono
magic_Nono 1878 Messages postés jeudi 16 octobre 2003Date d'inscription 16 mars 2011 Dernière intervention - 31 août 2004 à 14:07
0
Utile
résol effectivt avec RNA & algo génétiques

C + drole

Magic Nono: l'informagicien! 8-)
Commenter la réponse de magic_Nono
DevGizmo 122 Messages postés lundi 16 décembre 2002Date d'inscription 27 février 2007 Dernière intervention - 31 août 2004 à 15:51
0
Utile
Je suis pas tellement d'accord avec ce que tu dis: je m'explique:
effectivement et naivement on peut penser que la reconnaissance entre deux signaux peut se faire en regardant les min max et autres parametres de la "forme" du signal...mais cela ne s'arrete et ne commence pas par la...
Imagine que tu enregistre ta voix avec un micro et que tu veux la comparer a un autre signal de maniere a "voir" si c'est la meme chose de maniere a declencher une serie de traitement. Quand la voix est enregistree ce sera avec l'accent, la voix en elle meme (homme/femme:grave/un peu plus aigu), le bruit autour de la personne qui s'enregistre => plein de parametres qui vont faire que le signal ne sera pas comparable directement ou meme indirectement; je pense donc que ce n'est pas de la reconnaissance de forme...
Commenter la réponse de DevGizmo
tagboys 42 Messages postés lundi 28 avril 2003Date d'inscription 28 mars 2014 Dernière intervention - 31 août 2004 à 17:22
0
Utile
Merci essirc pour le tuto sa va me donner une bonne parti :)
mais j'y vais pour la reconnaissance vocal ou reconnaissance de formes
Commenter la réponse de tagboys
magic_Nono 1878 Messages postés jeudi 16 octobre 2003Date d'inscription 16 mars 2011 Dernière intervention - 31 août 2004 à 18:26
0
Utile
totalement d'ac avec toi

mais regarde les labos de recherches, la reco vocale est tjs ds les labos RF.

Bref, ce n'est qu'une guerre de terme et C stérile.
En tt cas... utilise des bibli préexistantes puis si sa t'amuse, fait les évoluer....
les rech sont tjs en cours alors...
tu peux contribuer
mé sois vraiement callé qd tu t'y lancera
++

Magic Nono: l'informagicien! 8-)
Commenter la réponse de magic_Nono
tagboys 42 Messages postés lundi 28 avril 2003Date d'inscription 28 mars 2014 Dernière intervention - 31 août 2004 à 19:05
0
Utile
merci du conseille nous sommes 4 qui travaille sur se projets allors nous allons surement aboutir a quelque chose
Commenter la réponse de tagboys
cs_jeron 29 Messages postés lundi 30 juin 2003Date d'inscription 25 juillet 2014 Dernière intervention - 6 oct. 2006 à 23:50
0
Utile
cela marche t'il avec devcpp ou aut il faire comme d'habitude avec un projet MVisual studio ?
Commenter la réponse de cs_jeron
cs_jeron 29 Messages postés lundi 30 juin 2003Date d'inscription 25 juillet 2014 Dernière intervention - 6 oct. 2006 à 23:56
0
Utile
bon alors c'est non.il faut installer leprogramme et se debrouiller avec le c++ et xml.bon courage a tous les passionés comme moi
Commenter la réponse de cs_jeron
Yuudo 2 Messages postés mercredi 17 janvier 2007Date d'inscription 5 août 2008 Dernière intervention - 18 janv. 2007 à 20:45
0
Utile
Bonjour,
Je ne sais pas ou poster ma demande...excusez-moi à l' avance si ce n'est pas l'endroit.

Je suis à la recherche de conseils et de développeurs passionnés pour monter un petit groupe de travail et de recherche autour de l’environnement Client/serveur et la reconnaissance et synthèse vocale dans un environnement Apache/Tomcat, PHP, MySQL, JAVA. Notre objectif est de développer une petite application innovante et passionnante pour permettre de faire une démonstration et montrer les possibilités que peuvent offrir les technologies actuelles. L'idée (tres simplifier du projet) est de passer des requettes SQL entre un poste client et un serveur web grace à la voix. La reponse de cette requette est effectue en synthese vocale sur le poste client.

Si ce projet vous interesse et que vous souhaitez en savoir plus je serai ravi de vous en parler.

merci pour vos reponses et votre aide....
Lionel.
Commenter la réponse de Yuudo
cs_mimaaaa 2 Messages postés samedi 11 août 2007Date d'inscription 6 août 2008 Dernière intervention - 5 août 2008 à 18:01
0
Utile
Bonjour,
je sais que mon poste est en retard masi bon, je tente ma chance.
Je suis en stage et j'ai comme mission de réaliser une aplication de reconnaissance vocale, l'utilisateur doit passer une commande vocale et auserveur de l'executer.
là je suis étourdie, si vous avez des pistes à me donner.
Merci pour votre aide.
Commenter la réponse de cs_mimaaaa
Yuudo 2 Messages postés mercredi 17 janvier 2007Date d'inscription 5 août 2008 Dernière intervention - 5 août 2008 à 22:05
0
Utile
Bonjour,

Je viens de prendre connaissance de votre post...je vous propose de regarder ce site www.yuudo.com . Si cela vous interesse, ce personnage a besoin d'une application de reconnaissance vocale. n'hesitez pas à me contacter à travers le site du Yuudo si vous avez des questions.
Commenter la réponse de Yuudo
cs_mimaaaa 2 Messages postés samedi 11 août 2007Date d'inscription 6 août 2008 Dernière intervention - 6 août 2008 à 11:44
0
Utile
Merci yuudo pour ton post,


j'ai vu le lien joint, c'est interessant et original le petit bonhome de compagnie :)


moi je suis déjà engagé dans un stage, je cherche de l'aide, des exeples de routine qui peuvent m'aider à démarrer mon projet.
Au fait, l'application doit pouvoir enregistrer des sons qui sont des instructions de commande. l'enregistrement ne cause pas de probleme, avec l'api java sound c'est faisable, il faudrait ensuite qd l'utilisateur prononce un mot, il doit etre reconnu (comparé avec l'ensemble des commandes deja enregistrées) et executer l'instruction correspondante.
comment faire cela !!!! je cherche encore.
je vous remercie pour votre attention et votre aide.
Commenter la réponse de cs_mimaaaa

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes et codes sources.

Le fait d'être membre vous permet d'avoir des options supplémentaires.