=========================================================================== 29/10/2003 =========================================================================== =========================================================================== Programa "Reconocimiento de vocales" - Projecte Fressa 2003 - www.lagares.org =========================================================================== CASTELLANO =========================================================================== Este es un programa experimental para estudiar el reconocimiento automático de las vocales. Pensado con dos objetivos: 1-Científico. Para conocer que son y que distingue a las distintas vocales desde el punto de vista de su sonido. 2-Lopgopédico. Para ayudar a personas con dificultades del habla a articular las vocales. Si tuviera cierto éxito en este cometido se podría tratar de ampliar a la articulación de sílabas y... ???? de palabras. Utiliza unos parámetros estudiados en unos casos concretos de voz, lo cual hace que si la voz no tiene unos parámetros parecidos a la voz estudiada puede ser que el reconocimiento no sea muy bueno. De hecho uno de los objectivos es ver si los parámetros que se miden identifican o no a las distintas vocales, y si no, tratar de propone algunos de más generales (y mejores). Concretamente el programa tiene dos modos de reconocimiento. Uno a partir de voces graves (sacados a partir de la voz de varios muchachos mayores) y otro de voces agudas (sacados a partir de la voz de varias muchachas mayores). Lo que proponemos es que la gente lo pruebe para ver si el porcentage de aciertos es bajo o alto. Para lo cual hay la opción, Experimentar, en el que el programa propone vocales al azar, el usuario ha de decirlas, el programa realiza el reconocimiento y un estudio estadístico de los aciertos y errores. Al final permite guardar el sonido con los errores y los resultados y facilita el hecho de enviarlos al autor del programa, Jordi Lagares Roset, para ver si realmente el sistema de reconocimiento funciona o no, y si este es el caso, tratar de mejorarlo. Por lo cual agradecemos de antemano la colaboración de la gente que haga dichos experimentos y envie los resultados. =========================================================================== FUNCIONAMIENTO =========================================================================== Al ejecutar el programa ya funciona el reconocimiento. Por lo cual si decimos una vocal al micrófono, el programa escribirá la vocal que reconozca. A, E, I, O, U. Hay el menú, Català, que lo que hace es reconocer: A, AE, È, É, I, O, U. Si tenemos una voz aguda, 160 o más hertz, o vemos que confunde las vocales I->E, o O->A podemos activar la opción, voz aguda y ver si mejora el reconocimiento. Para parar el reconocimiento (o reiniciarlo si está parado) podemos activar el menú, Empezar/parar o el botón. El menú archivo tiene la opción, Guardar, para guardar un sonido como fichero wav, por si considerais que quereis enviarme un sonido concreto. El botón de la derecha hace la misma función. La opción experimentar del menú archivo permite que el programa haga estadísticas de su capacidad de reconocimiento así como guardar los errores para podermelos enviar y así yo poder saber si el sistema funciona, o no, y tratar de mejorarlo (comentado anteriormente) Se debe enviar dos archivos, el programa nos dice su nombre y la ruta para poderlos adjuntar fácilmente a un mensaje de correo. La dirección donde se deben enviar es, jordi@lagares.org Si clicais en el botón, Abrir programa de correo electrònico, se ha de abrir el outlook o el programa de correo que tuvierais y crea un mensaje nuevo con la dirección correcta, jordi@lagares.org. Para adjuntar los archivos ir al menú, insertar archivo, o bién clic en el clip y donde pone, Nombre del archivo, podeis copiar la ruta del archivo. Por ejemplo: C:\Projecte Fressa 2003\exes\prova.wav Pulsar return y hacer lo mismo con el segundo archivo C:\Projecte Fressa 2003\exes\prova.wav.txt Si eso no funcionase hacerlo de manera manual, abriendo el programa de correo, creando un mensaje nuevo y adjuntando dichos archivos. No es necesario escribir nada en el cuerpo del mensaje, pero si quereis hacerme algún comentario aprovechad el mensaje para hacerlo, será bien recibido. ATENCIÓN: Las vocales reconocidas salen de color azul. Si salen de color rojo significa que la señal está saturada, es decir demasiado elevada de volumen. Por lo que: 1-Se puede bajar el nivel de entrada del micrófono. Para hacerlo ir al menú: Control de volumen del micrófono. Y bajar el nivel de entrada de sonido del micrófono. 2-Apartar el micrófono de la boca. 3-Hablar más bajo. =========================================================================== CONSIDERACIONES =========================================================================== Es una primera versión fruto de estudios hechos al sonido de muchas vocales durante el verano de 2003. A ver si a partir de ella podemos mejorar el conocimiento que tenemos de las vocales para así mejorar su reconocimiento automático y ayudar a personas con dificultades. Muchas gracias. Jordi Lagares i Roset - www.lagares.org - jordi@lagares.org - 26 de Octubre 2003 =========================================================================== =========================================================================== =========================================================================== Programa "Reconeixement de vocals" - Projecte Fressa 2003 - www.lagares.org =========================================================================== CATALÀ =========================================================================== Aquest és un programa experimental per estudiar el reconeixement automàtic de les vocals. Pensat amb dos objectius: 1-Científic. Per a conèixer que són i que distingueix a les diverses vocals desde el punt de vista del seu so. 2-Logopèdic. Per ajudar a persones amb dificultats de parla a articular les vocals. Si tingués cert èxit es podria tractar d'ampliar a l'articulació de síl.labes i... ???? de paraules. Per defecte fa servir uns paràmetres estudiats en un cert tipus de veu, la qual cosa fa que si la veu no té uns paràmetres semblants a la veu estudiada pot ser que el reconeixement sigui dolent. De fet un dels objectius és veure si els paràmetres que es mesuren identifiquen o no a les diferents vocals, i si no, tractar de proposar-ne alguns de més generals (i millors). Concretament el programa té dos modus de reconeixement, un a partir de veus greus (trets a partir de la veu d'uns quants nois grans) i un altre de veus agudes (trets a partir de la veu d'unes quantes noies grans). El que proposem és que la gent el provi per veure si el percentatge d'encerts és alt o baix. Per la qual cosa hi ha l'opció, Experimentar, en que el programa proposa vocals a l'atzar, l'usuari les ha de dir, el programa fa el reconeixement i un estudi estadistic dels encerts i errors. Al final permet guardar el so amb els errors i els resultats i facilita el seu enviament a l'autor del programa, Jordi Lagares Roset, per veure si realment el sistema de reconeixement funciona, o no, i si és aquest el cas, tractar de millorar-lo. Per la qual cosa agraïm la col.laboració de la gent fent els experiments i enviant els resultats. =========================================================================== FUNCIONAMENT =========================================================================== Nomes d'executar el programa, ja funciona el reconeixement. Per la qual cosa si diem vocals al micròfon, el programa ens escriurà la que reconeix. A, AE, È, É, I, O, U. Hi ha el menú, Castellano, que el que fa és reconèixer només: A, E, I, O, U. Si tenim una veu aguda, 160 o més hertz, o veiem que ens confon les lletres I->É, É->È, O->A podem activar l'opció, veu aguda i veure si millora el reconeixement. Per parar el reconeixement (o reiniciar-lo si està parat) podem activar el menú, Engegar/parar o el botó. El menú fitxer té l'opció Guardar, per desar un so com a fitxer wav, per si considereu que voleu enviar-me un so concret. El botó de la dreta fa la mateixa funció. L'opció experimentar del menú fitxer permet que el programa faci estadístiques de la seva capacitat de reconeixement així com guardar els errors per poder-me-los enviar i així jo poder saber si el sistema funciona, o no, i tractar de millorar-lo (comentat anteriorment) Cal enviar dos fitxers. El programa en diu el seu nom i ruta per adjuntar-los fàcilment a un missatge de correu. L'adreça on cal enviar-los és, jordi@lagares.org Si cliqueu el botó, Abrir programa de correo electrònico, ha d'obrir l'outlook o el programa de correu que tingueu i crea un missagte nou amb l'adreça correcta, jordi@lagares.org. Per adjuntar els arxius aneu al menú, insertar archivo, o bé cliqueu en el clip, i on posa, Nombre del archivo, i podeu copiar la ruta directa de l'arxiu, per exemple: C:\Projecte Fressa 2003\exes\prova.wav Premeu return i feu el mateix amb el segon arxiu C:\Projecte Fressa 2003\exes\prova.wav.txt Si aixó no funcionés feu-ho de manera manual. Obrint el programa de correu, creant un missatge nou i adjuntant els dos arxius. No cal que escriviu res en el cos del missatge, però si voleu fer algun comentari, aprofiteu el missatge, serà ben rebut. ATENCIÓ: Les vocals reconegudes surten de color blau. Si surten de color vermell significa que el senyal està saturat, es a dir massa elevat de volum. Per la qual cosa: 1-Se pot baixar el nivell d'entrada del micròfon. Per fer-ho aneu al menú: Control de volume del micròfon. I baixeuel nivell d'entrada de so del micròfon. 2-Aparteu el micròfon de la boca. 3-Parleu més fluix. =========================================================================== CONSIDERACIONS =========================================================================== És una primera versió fruit d'estudis fets al so de moltes vocals durant l'estiu 2003. A veure si a partir d'ella podem millorar el coneixement que tenim sobre les vocals per així millorar el seu reconeixement i ajudar a la parla a persones amb dificultats. Moltes Mercès. Jordi Lagares i Roset - www.lagares.org - jordi@lagares.org - 2 de Setembre 2003