Lettre de ligason :

Seleccionatz vòstra lenga

Tecnologias de la lenga

Traitement automatique du langage

Lo numeric occitan s'es desvolopat d'una faiçon generala aquestas annadas : contenguts enciclopedics (Wikipédia), patrimòni (Occitanica), mèdias (Octele), rets socialas son tant de sectors d'ara enlà investits. Pasmens la lenga occitana patís totjorn d'un important retard numeric amb per consequéncia, una abséncia quasi totala dins d'espleches d'ara enlà corrents (burotica, telefonia mobila, etc.). La prégnance creissenta d'aquelas tecnologias dins la vida vidanta (trabalh, desplaçaments, consomacion, educacion, vida sociala) fan de tecnologias del lengatge un factor suplementari de marginalizacion per una lenga ja minorizada.

"lo Congrès a engatjat mantun programa de desvolopament
de las tecnologias lengatgièras per l'occitan.

Aquel fenomèn es descrich e analisat dins un estudi realizat per META-NET, una ret de recèrca amassant diferentas institucions, universitats e centres de recèrca e dont la mission principala es la mesa en plaça de fondacions tecnologicas solidas per una Euròpa multilingua. Son Libre blanc fa un estat actual de las ressorsas e tecnologias del lengatge per trenta lengas europèas dins sièis domenis (la traduccion automatica, la sintèsi e la reconeissença vocalas, la correccion ortografica, l'analisi semantica, l'analisi gramaticala e la generacion automatica de tèxt) e prepausa egalament una grasilha comuna de classificacion e d'avaloracion de las ressorsas e espleches numerics. Los resultats de l'estudi son particularament alarmants : los editors soslinhan l'escart creissent entre los « grandas » e las « pichonas » lengas, es indispensable d'equipar totas las lengas (e mai las mai pichonas e las mens dotadas) de las tecnologias de basa necessàrias, sens qué aquelas lengas son condemnadas a « l'extincion numerica ».

"mantun programa operacional (traductor automatic,
sintèsi vocala, reconeissença vocala, etc.).

Per aquò far, l'estudi preconiza la creacion massisa de donadas, la mutualizacion al nivèl europèu, lo transferiment tecnologic entre las lengas, l'interopérabilité de las ressorsas, dels espleches e dels servicis.
Dins aquel encastre, lo Congrès amb l'ensemble de sos partenaris scientifics e institucionals a engatjat mantun programa de desvolopament de las tecnologias lengatgièras per l'occitan : en 2014 es redigida la Fuèlha de rota de desvolopament numeric l'occitan, un document quadre pluriannal de planificacion de las òbras, serà seguida de mantun programa operacional (traductor automatic, sintèsi vocala, reconeissença vocala, clavièr predictiu, còrpus, etc.).


La Farga es lo portal collaboratiu TAL (tractament automatic de la lenga) per l'occitan. Accediretz a l'ensemble de las ressorsas existentas gràcias a l'inventari de las ressorsas, poiretz telecargar los espleches (API, moduls/plug-in), dintrar en contacte amb la comunautat e far conéisser vòstres projèctes.

 

Ne saber mai

Formatage TEI

Lo Congrès utiliza la nòrma TEI dins l'encastre de son projècte Lexics, qu'a per tòca de formatar totes sos lexics

Veire la pagina

Codes IANA de varietats

Codes estandardizats per tal d'identificar las lengas, lors varietats, lors grafias e lors alfabets.

Veire la pagina

Etiquettes de POS

Jòc d'etiquetas gramaticalas adaptat a la lenga occitana.

Veire la pagina

Ne saber mai

Tractament automatic de las lengas

Lo Congrès convertís totas sas ressorsas al format TEI (Text Encoding Iniciativa)

Veire la pagina

Ne saber mai

Grafia / phonie

La nòrma grafica emplegada, recomandada e gerida pel Congrès es la grafia dicha classica.

Veire la pagina

Lexicografia

Lo Basic se vòl un diccionari unic per totes los locutors e usatgièrs de l'occitan, quala que siá lor varianta.

Veire la pagina

Gramatica

Lo conjugueur automatic vèrbòc e la gramatica en linha wikigram son d'espleches d'ara enlà accessibles en linha.

Veire la pagina

Onomastica

De nombrosas òbras son estats menats per restaurar e valorizar las formas toponimicas occitanas.

Veire la pagina

Terminologia

La basa terminologica occitana tèrmòc prepausa un accès unic a totes los lexics especializats.

Veire la pagina

Unitats de mesura

Lo Sistèma Internacional d'Unitats es lo sistèma d'unitats de mesura lo mai utilizat al mond. 

Veire la pagina

TAL

Lo Congrès a definit dels estandards per l'etiquetatge informatic de sos lexics e sos còrpus.

Veire la pagina

Bibliografia

Lo Congrès procedís a un inventari general per tal de definir una basa referenciala de trabalh.

Veire la pagina