reconnaissance vocalRésolu

Question

Bon j'orait besoin d'un peut d'aide par raport a la reconnaisance vocal.
en breff je veut comparer la voix d'une personne (mp3) a celle d'un micro . je sais que la meilleur facon serait par les bytes les comparer .... mais pour comparer sa serait mieux de decompresser le mp3 ses la ou qu'il y a le ik. 
comparer les sequences a la voix devrais surement prendre une API ms agent (windows) si quelqu'un a deja tente un tel projet il serait aimable de me donner un ptit coup de pouce 
                              merci

essirc · Accepted Answer

Alors la SpeechAPI est faite pour toi :) En plus y a de bons exemples livrés avec. 

Tu verras c'est pas très compliqué, il suffit juste de faire un petit fichier XML avec les commandes à reconnaitre (ex : ouvrir, fermer, quitter...). Et l'API te renverra des tokens en fonction de ce qui a été reconnu. Tu auras juste à les traiter dans un switch et à effectuer les actions nécessaires.

glipper · Answer

Ouh la la la la à mon avis c'est pas si simple....
Glipper

essirc · Answer

Je crois que glipper a raison, la reconnaissance vocale ne se limite pas à une comparaison d'octets entre deux flux audio. Pour ce qui est de l'API, MSAgent se contente d'effectuer une synthèse vocale, pour la reconnaissance il faut utiliser la SpeechAPI (SAPI). Cette API offre deux modes de fonctionnement : la reconnaissance de commande et la dictée.

Si ton application se limite à une reconnaissance de commande je peux te fournir quelques exemples de programmes pour démarrer.

Bon courage.

tagboys · Answer

Oui effectivement  essirc "SpeechAPI" j'ai deja entendu parler mais pas plus qui faut , sa serait plus la reconnaisance de commande j'ai l'intention de faire (les racourcis clavier) en vocal.

tagboys · Answer

oki merci :) mais les programme peut tu me donner leur lien.

puis SpeechAPI ou que je pourait aprendre a l'utiliser

essirc · Answer

Voici un lien vers un tutoriel qui décrit les différentes étapes de la conception d'un petit programme de dessin commandé par la voix (en utilisant la SAPI de M$).

http://www.generation5.org/content/2001/sr00.asp

magic_Nono · Answer

mieux vau utiliser des bibli existantes, ton pb fait parti de la reconnaissance des formes qui est l'un des plus gros pb de prog....

++

Magic Nono: l'informagicien!  8-)

DevGizmo · Answer

magic_Nono> reconnaissance de formes != reconnaissance vocale

par contre effectivement le probleme peut se resoudre a l'aide de reseau de neuronnes....bref un truc "imbitable" pour chercheur...

magic_Nono · Answer

le son = une forme, 

si si

dslé Gizmo

Magic Nono: l'informagicien! 8-)

magic_Nono · Answer

résol effectivt avec RNA & algo génétiques

C + drole

Magic Nono: l'informagicien! 8-)

DevGizmo · Answer

Je suis pas tellement d'accord avec ce que tu dis: je m'explique:
effectivement et naivement on peut penser que la reconnaissance entre deux signaux peut se faire en regardant les min max et autres parametres de la "forme" du signal...mais cela ne s'arrete et ne commence pas par la...
Imagine que tu enregistre ta voix avec un micro et que tu veux la comparer a un autre signal de maniere a "voir" si c'est la meme chose de maniere a declencher une serie de traitement. Quand la voix est enregistree ce sera avec l'accent, la voix en elle meme (homme/femme:grave/un peu plus aigu), le bruit autour de la personne qui s'enregistre => plein de parametres qui vont faire que le signal ne sera pas comparable directement ou meme indirectement; je pense donc que ce n'est pas de la reconnaissance de forme...

tagboys · Answer

Merci essirc pour le tuto sa va me donner une bonne parti :) 
mais j'y vais pour la reconnaissance vocal ou reconnaissance de formes

magic_Nono · Answer

totalement d'ac avec toi

mais regarde les labos de recherches, la reco vocale est tjs ds les labos RF.

Bref, ce n'est qu'une guerre de terme et C stérile.
En tt cas... utilise des bibli préexistantes puis si sa t'amuse, fait les évoluer....
les rech sont tjs en cours alors...
tu peux contribuer 
mé sois vraiement callé qd tu t'y lancera
++

Magic Nono: l'informagicien! 8-)

tagboys · Answer

merci du conseille nous sommes 4 qui travaille sur se projets allors nous allons surement aboutir a quelque chose

cs_jeron · Answer

cela marche t'il avec devcpp ou aut il faire comme d'habitude avec un projet MVisual studio ?

cs_jeron · Answer

bon alors c'est non.il faut installer leprogramme et se debrouiller avec le c++ et xml.bon courage a tous les passionés comme moi

Yuudo · Answer

Bonjour,
Je ne sais pas ou poster ma demande...excusez-moi à l' avance si ce n'est pas l'endroit.

Je suis à la recherche de conseils et de développeurs passionnés pour monter un petit groupe de travail et de recherche autour de l’environnement Client/serveur et la reconnaissance et synthèse vocale dans un environnement Apache/Tomcat, PHP, MySQL, JAVA. Notre objectif est de développer une petite application innovante et passionnante pour permettre de faire une démonstration et montrer les possibilités que peuvent offrir les technologies actuelles. L'idée (tres simplifier du projet) est de passer des requettes SQL entre un poste client et un serveur web grace à la voix. La reponse de cette requette est effectue en synthese vocale sur le poste client.

Si ce projet vous interesse et que vous souhaitez en savoir plus je serai ravi de vous en parler.

merci pour vos reponses et votre aide....
Lionel.

cs_mimaaaa · Answer

Bonjour, 
je sais que mon poste est en retard masi bon, je tente ma chance.
Je suis en stage et j'ai comme mission de réaliser une aplication de reconnaissance vocale, l'utilisateur doit passer une commande vocale et auserveur de l'executer.
là je suis étourdie, si vous avez des pistes à me donner.
Merci pour votre aide.

Yuudo · Answer

Bonjour,

Je viens de prendre connaissance de votre post...je vous propose de regarder ce site www.yuudo.com . Si cela vous interesse, ce personnage a besoin d'une application de reconnaissance vocale. n'hesitez pas à me contacter à travers le site du Yuudo si vous avez des questions.

cs_mimaaaa · Answer

Merci yuudo pour ton post,


j'ai vu le lien joint, c'est interessant et original le petit bonhome de compagnie :)


moi je suis déjà engagé dans un stage, je cherche de l'aide, des exeples de routine qui peuvent m'aider à démarrer mon projet.
Au fait, l'application doit pouvoir enregistrer des sons qui sont des instructions de commande. l'enregistrement ne cause pas de probleme, avec l'api java sound c'est faisable, il faudrait ensuite qd l'utilisateur prononce un mot, il doit etre reconnu (comparé avec l'ensemble des commandes deja enregistrées) et executer l'instruction correspondante.
comment faire cela !!!! je cherche encore.
je vous remercie pour votre attention et votre aide.

Reconnaissance vocal

20 réponses

Votre réponse

Discussions similaires