Lettre de ligason :

Seleccionatz vòstra lenga

Thesoc

 THESOC-Thesaurus occitan
" Un tresaur amassant una molonada de donadas lingüisticas occitanas "

Jos la dobla tutèla del C.N.R.S. (seccions 34 e 26) e de l'Universitat Còsta d'Azur, lo laboratòri UMR 7320 Basas, Còrpus, Lengatge (BCL) compta una seissantena de membres, cercaires, ensenhaires-cercaires, associats, engenhaires, tecnicians, doctorants e administratius. L'objècte d'estudi de BCL es lo lengatge, de son arquitectura cognitiva a sas realizacions discursivas o textuelles las mai concrètas. Per aquel espèctre larg que mena de cervèl a l'esperit, de la lenga a la paraula e del discors a l'escrich, per l'analisi e la modelizacion dels sistèmas fonologic, morfologic e sintaxic, de las estructuras discursiva e textuelle, mas tanben de las foncions psycho-cognitivas, BCL a un apròchi intégrative e interdisciplinari del lengatge que li permet d'associar dins de dinamicas crosadas lingüistas de la lenga, lingüistas del discors e psicològs cognitivistes.

A engatjat mantun protocòl experimental, metòdes de tractament e esplech de recèrca dont lo THESAURUS OCCITAN (THESOC). Sa creacion remonta al collòqui de Wégimont organizat per l'AIEO en abril de 1989 e consacrat als « Espleches de la recèrca occitana ». Demest las conclusions d'aquel collòqui figura l'idèa que l'una de las foncions essencialas de l'AIEO consistís a suscitar e a sostenir qualques obradors especifics dins lo domeni dels estudis occitans, susceptibles de dinamizar e de federar las energias de recèrca e d'abotir a l'elaboracion d'espleches de pedagogia e de recèrca a metre a la disposicion de la comunautat. Lo THESOC a alara espelit jos la direccion de Jean-Philippe DALBERA e es basat al laboratòri « Basas, Còrpus, Lengatge » (UMR 7320 CNRS - Universitat Còsta d'Azur). S'agís d'un esplech de trabalh a la disposicion dels cercaires, dels pedagògs e del public. Compòrta dos contravents :

1. De ressorsas : mots, tèxtes, sons, videos, imatges. Es un tresaur amassant una molonada de donadas lingüisticas occitanas, que procedisson totas de fonts oralas, a saber de donadas lingüisticas e périlinguistiques eissidas d'enquèstas de terren (cartas e quasernets d'enquèsta dels Atlasses lingüistics, monografias, enregistraments sonòrs e videos, documents iconografics), de donadas lingüisticas procedissent d'analisis ja realizadas (dins los domenis de la lematizacion, dins los domenis morfologic, etimologic, etc.), de las donadas bibliograficas

2. D'espleches d'analisi : lo THESOC es actualament en plena refonda. Sas foncionalitats seràn implementadas progressivament sul sit.

" Un interfaçage amb lo Dicodòc "

lo C.N.R.S. e lo Congrès permanent de la lenga occitana an engatjat una associacion scientifica e tecnica pluriannal qu'a per mira de la mesa en interaccion del THESOC e de l'infrastructura numerica del Congrès. Un primièr flòc de desvolopaments es actualament en cors :

1. Actualizacion de la lematizacion del THESOC Melhorar la lematizacion del THESOC per un melhor interfaçage amb lo dicodòc :

• la notacion dels accents suls lemas creats ;

• los noms pròpris ;

• l'estatut dels mots compausats vs sintagmas (i.e. amb tirets o sens tirets ?). Determinar se s'agiguèt d'una forma palficada possedissent una categoria gramaticala e qu'auriá vocacion a figurar coma una dintrada d'un diccionari, o plan se s'agiguèt puslèu d'una expression.

• las correccions necessàrias del ponch de vista del Congrès, dins la perspectiva lexicografica occitana, als lemas presents dins lo diccionari d'Alibert (sustot dins l'optica de los poder puèi utilizar coma malhon intermediari per s'interfacer amb los diccionaris del Congrès).

• proposicions / suggestions de lemas per un certan nombre de formas atestadas dins lo THESOC e presentas dins lo diccionari de Simin Palay mas absentas d'Alibert (actualament, aqueles lemas son estats sasits dins lo THESOC amb la forma grafica prepausada per Simin Palay, una adaptacion en grafia classica fa besonh).

2. Ligason THESOC->dicodòc :

• remandament cap al dicodòc se recèrca infruchosa

• remandament cap al dicodòc per ne saber mai sus un lema (conjugasons, rimas, sinonims, exemples en contèxt, etc.)

• Afichar lo lema pendent una recèrca per forma plegada, per afichar un bon resultat (possibilitat de passar per la futura API Mots)

• Proposicion de sinonims (en cas de recèrca infruchosa sul lema recercat, mas preséncia de resultats per un lema sinonim dins lo THESOC), gràcias a l'utilizacion de l'API Sinonims desvolopada pel Congrès.

3. Ligason dicodòc->THESOC

• Integrar dins los resultats de recèrca una lista de las traduccions amb qualques informacions e ligam cap al THESOC.

• Integrar una cartografia de las ocurréncias (o de las ocurréncias de las traduccions) dins los resultats de recèrca.

L'objectiu es, per l'armonizacion e l'interfaçage de las donadas, d'afortir la complementaritat de doas infrastructuras numericas occitanas de referéncia (l'una essent normativa e l'autra descriptiva), amb pel Congrès la perspectiva d'integrar lo THESOC dins la futura plataforma lexicala, textuelle e toponimica. Los usatgièrs del Congrès auràn atal un accès optimizat (cartografia restituïssent las ocurréncias) a aquel vertadièr tresaur occitan qu'es lo THESOC.