Reconnaissance vocal [Résolu]

Signaler
Messages postés
42
Date d'inscription
lundi 28 avril 2003
Statut
Membre
Dernière intervention
28 mars 2014
-
Messages postés
2
Date d'inscription
samedi 11 août 2007
Statut
Membre
Dernière intervention
6 août 2008
-
Bon j'orait besoin d'un peut d'aide par raport a la reconnaisance vocal.
en breff je veut comparer la voix d'une personne (mp3) a celle d'un micro . je sais que la meilleur facon serait par les bytes les comparer .... mais pour comparer sa serait mieux de decompresser le mp3 ses la ou qu'il y a le ik.
comparer les sequences a la voix devrais surement prendre une API ms agent (windows) si quelqu'un a deja tente un tel projet il serait aimable de me donner un ptit coup de pouce
merci

20 réponses

Messages postés
48
Date d'inscription
vendredi 23 juillet 2004
Statut
Membre
Dernière intervention
26 juillet 2005
3
Alors la SpeechAPI est faite pour toi :) En plus y a de bons exemples livrés avec.

Tu verras c'est pas très compliqué, il suffit juste de faire un petit fichier XML avec les commandes à reconnaitre (ex : ouvrir, fermer, quitter...). Et l'API te renverra des tokens en fonction de ce qui a été reconnu. Tu auras juste à les traiter dans un switch et à effectuer les actions nécessaires.
Messages postés
246
Date d'inscription
dimanche 2 juin 2002
Statut
Membre
Dernière intervention
11 septembre 2016
1
Ouh la la la la à mon avis c'est pas si simple....
Glipper
Messages postés
48
Date d'inscription
vendredi 23 juillet 2004
Statut
Membre
Dernière intervention
26 juillet 2005
3
Je crois que glipper a raison, la reconnaissance vocale ne se limite pas à une comparaison d'octets entre deux flux audio. Pour ce qui est de l'API, MSAgent se contente d'effectuer une synthèse vocale, pour la reconnaissance il faut utiliser la SpeechAPI (SAPI). Cette API offre deux modes de fonctionnement : la reconnaissance de commande et la dictée.

Si ton application se limite à une reconnaissance de commande je peux te fournir quelques exemples de programmes pour démarrer.

Bon courage.
Messages postés
42
Date d'inscription
lundi 28 avril 2003
Statut
Membre
Dernière intervention
28 mars 2014

Oui effectivement essirc "SpeechAPI" j'ai deja entendu parler mais pas plus qui faut , sa serait plus la reconnaisance de commande j'ai l'intention de faire (les racourcis clavier) en vocal.
Messages postés
42
Date d'inscription
lundi 28 avril 2003
Statut
Membre
Dernière intervention
28 mars 2014

oki merci :) mais les programme peut tu me donner leur lien.

puis SpeechAPI ou que je pourait aprendre a l'utiliser
Messages postés
48
Date d'inscription
vendredi 23 juillet 2004
Statut
Membre
Dernière intervention
26 juillet 2005
3
Voici un lien vers un tutoriel qui décrit les différentes étapes de la conception d'un petit programme de dessin commandé par la voix (en utilisant la SAPI de M$).

http://www.generation5.org/content/2001/sr00.asp
Messages postés
1878
Date d'inscription
jeudi 16 octobre 2003
Statut
Membre
Dernière intervention
16 mars 2011
1
mieux vau utiliser des bibli existantes, ton pb fait parti de la reconnaissance des formes qui est l'un des plus gros pb de prog....

++

Magic Nono: l'informagicien! 8-)
Messages postés
122
Date d'inscription
lundi 16 décembre 2002
Statut
Membre
Dernière intervention
27 février 2007
1
magic_Nono> reconnaissance de formes != reconnaissance vocale

par contre effectivement le probleme peut se resoudre a l'aide de reseau de neuronnes....bref un truc "imbitable" pour chercheur...
Messages postés
1878
Date d'inscription
jeudi 16 octobre 2003
Statut
Membre
Dernière intervention
16 mars 2011
1
le son = une forme,

si si

dslé Gizmo

Magic Nono: l'informagicien! 8-)
Messages postés
1878
Date d'inscription
jeudi 16 octobre 2003
Statut
Membre
Dernière intervention
16 mars 2011
1
résol effectivt avec RNA & algo génétiques

C + drole

Magic Nono: l'informagicien! 8-)
Messages postés
122
Date d'inscription
lundi 16 décembre 2002
Statut
Membre
Dernière intervention
27 février 2007
1
Je suis pas tellement d'accord avec ce que tu dis: je m'explique:
effectivement et naivement on peut penser que la reconnaissance entre deux signaux peut se faire en regardant les min max et autres parametres de la "forme" du signal...mais cela ne s'arrete et ne commence pas par la...
Imagine que tu enregistre ta voix avec un micro et que tu veux la comparer a un autre signal de maniere a "voir" si c'est la meme chose de maniere a declencher une serie de traitement. Quand la voix est enregistree ce sera avec l'accent, la voix en elle meme (homme/femme:grave/un peu plus aigu), le bruit autour de la personne qui s'enregistre => plein de parametres qui vont faire que le signal ne sera pas comparable directement ou meme indirectement; je pense donc que ce n'est pas de la reconnaissance de forme...
Messages postés
42
Date d'inscription
lundi 28 avril 2003
Statut
Membre
Dernière intervention
28 mars 2014

Merci essirc pour le tuto sa va me donner une bonne parti :)
mais j'y vais pour la reconnaissance vocal ou reconnaissance de formes
Messages postés
1878
Date d'inscription
jeudi 16 octobre 2003
Statut
Membre
Dernière intervention
16 mars 2011
1
totalement d'ac avec toi

mais regarde les labos de recherches, la reco vocale est tjs ds les labos RF.

Bref, ce n'est qu'une guerre de terme et C stérile.
En tt cas... utilise des bibli préexistantes puis si sa t'amuse, fait les évoluer....
les rech sont tjs en cours alors...
tu peux contribuer
mé sois vraiement callé qd tu t'y lancera
++

Magic Nono: l'informagicien! 8-)
Messages postés
42
Date d'inscription
lundi 28 avril 2003
Statut
Membre
Dernière intervention
28 mars 2014

merci du conseille nous sommes 4 qui travaille sur se projets allors nous allons surement aboutir a quelque chose
Messages postés
29
Date d'inscription
lundi 30 juin 2003
Statut
Membre
Dernière intervention
25 juillet 2014
2
cela marche t'il avec devcpp ou aut il faire comme d'habitude avec un projet MVisual studio ?
Messages postés
29
Date d'inscription
lundi 30 juin 2003
Statut
Membre
Dernière intervention
25 juillet 2014
2
bon alors c'est non.il faut installer leprogramme et se debrouiller avec le c++ et xml.bon courage a tous les passionés comme moi
Messages postés
2
Date d'inscription
mercredi 17 janvier 2007
Statut
Membre
Dernière intervention
5 août 2008

Bonjour,
Je ne sais pas ou poster ma demande...excusez-moi à l' avance si ce n'est pas l'endroit.

Je suis à la recherche de conseils et de développeurs passionnés pour monter un petit groupe de travail et de recherche autour de l’environnement Client/serveur et la reconnaissance et synthèse vocale dans un environnement Apache/Tomcat, PHP, MySQL, JAVA. Notre objectif est de développer une petite application innovante et passionnante pour permettre de faire une démonstration et montrer les possibilités que peuvent offrir les technologies actuelles. L'idée (tres simplifier du projet) est de passer des requettes SQL entre un poste client et un serveur web grace à la voix. La reponse de cette requette est effectue en synthese vocale sur le poste client.

Si ce projet vous interesse et que vous souhaitez en savoir plus je serai ravi de vous en parler.

merci pour vos reponses et votre aide....
Lionel.
Messages postés
2
Date d'inscription
samedi 11 août 2007
Statut
Membre
Dernière intervention
6 août 2008

Bonjour,
je sais que mon poste est en retard masi bon, je tente ma chance.
Je suis en stage et j'ai comme mission de réaliser une aplication de reconnaissance vocale, l'utilisateur doit passer une commande vocale et auserveur de l'executer.
là je suis étourdie, si vous avez des pistes à me donner.
Merci pour votre aide.
Messages postés
2
Date d'inscription
mercredi 17 janvier 2007
Statut
Membre
Dernière intervention
5 août 2008

Bonjour,

Je viens de prendre connaissance de votre post...je vous propose de regarder ce site www.yuudo.com . Si cela vous interesse, ce personnage a besoin d'une application de reconnaissance vocale. n'hesitez pas à me contacter à travers le site du Yuudo si vous avez des questions.
Messages postés
2
Date d'inscription
samedi 11 août 2007
Statut
Membre
Dernière intervention
6 août 2008

Merci yuudo pour ton post,


j'ai vu le lien joint, c'est interessant et original le petit bonhome de compagnie :)


moi je suis déjà engagé dans un stage, je cherche de l'aide, des exeples de routine qui peuvent m'aider à démarrer mon projet.
Au fait, l'application doit pouvoir enregistrer des sons qui sont des instructions de commande. l'enregistrement ne cause pas de probleme, avec l'api java sound c'est faisable, il faudrait ensuite qd l'utilisateur prononce un mot, il doit etre reconnu (comparé avec l'ensemble des commandes deja enregistrées) et executer l'instruction correspondante.
comment faire cela !!!! je cherche encore.
je vous remercie pour votre attention et votre aide.