Lettre de ligason :

Seleccionatz vòstra lenga

Actualitats

Le congrès de la langue occitane - Actualités
Lo congrès de la lenga occitana - Actualitats
LREC 2024
LREC 2024

Après lo traductor automatic occitan en 2020, lo prestigiós LREC, Conferéncia internacionala sus las Ressorsas lengatgièras e l'Avaloracion a tornarmai retengut un article scientific corédigé pel Congrès (Aura Séguier, Michaël Barret e Benaset Dazéas) e sa partenària tecnica Elhuyar (Iñigo Morcillo, Ander Corral, Igor Leturia, Xavier Sarasola) pertocant lo desvolopament de la reconeissença vocala en occitan.

La conferéncia LREC 2024 (dont l'edicion novèla se debanarà a Turin del 20 al 25 de mai de 2024) es un eveniment internacional màger dedicat a las ressorsas del lengatge (LR) e a l'avaloracion de tecnologias del lengatge (LT). L'objectiu de LREC es d'ofrir un apercebut de l'estat de l'art, explorar las orientacions novèlas ne recèrca e desvolopament e las tendéncias emergentas, d'escambiar d'informacions sus las LR e lors aplicacions, las metodologias e espleches d'avaloracion, las activitats en cors e previstas, las utilizacions e besonhs industrials, las exigéncias requeridas per la societat de l'informacion, tant en tèrmes de politica que de questions tecnologicas e  organisationnelles.

Lo fach qu'aquel article siá estat aprovat per èsser presentat a la conferéncia merita d'èsser mencionat. L'article retengut per LREC 2024 presenta la concepcion d'un sistèma de reconeissença vocala (Automatic System Recognition o ASR) per doas varietats de l'occitan, lo gascon e lo lengadocian. Un ASR neuronal de darrièra generacion es estat utilizat per l'occitan gascon e lengadocian amb un nombre modèst d'oras d'enregistrament (238 oras voses-tèxt alinhats) e de balhadas textuelles (amb un còrpus de 10 milions de mots). L'aumentacion de las donadas gràcias a un còrpus sintetic (generat gràcias a la traduccion automatica) es egalament estada testada.

La jurada a saludat lo suènh portat a la constitucion del còrpus, permetent una bona presa en compte de la variacion lingüistica, aital coma d'excellents resultats obtenguts malgrat de donadas limitadas : en efièch la reconeissença vocala en occitan obten a aquel jorn una qualitat de l'òrdre d'80% ! Serà a tèrme accessible dempuèi una plataforma grand public que serà creada entre sortir del programa POCTEFA LINGUATEC-IA.

La reconeissença vocala es una tecnologia  obrissent de novèlas perspectivas per la lenga occitana. En efièch la transcripcion automatica - associada a la traduccion automatica - de videos òbra al benefici de sa difusion e d'una inclusion melhora dins la societat de comunicacion actuala : mèdias, rets socialas, comunicacion institucionala.

Previst dins la fuèlha de rota de desvolopament numeric de l'occitan e sostengut per las regions Novèla Aquitània e Occitània, l'Euroregion Novèla Aquitània-Euskadi-Navarra e lo departament de Pirenèus Atlantics, lo programa es estat realizat per un consòrci amassant la fondacion Elhuyar (Euskadi), lo Congrès (Novèla Aquitània) e Rolde d'Estudios Aragoneses (Aragon, qu'a desvolopat la meteissa tecnologia per la lenga aragonesa). Es egalament estat permés gràcias a una associacion amb près de cinquanta editors e productors de contenguts en occitan per la constitucion del còrpus.