Lettre de ligason :

Seleccionatz vòstra lenga

Etiquettes de POS

Dins lo domeni del TAL, existís mantun estandard internacional per etiquetar las categorias gramaticalas dels mots (Eagles, Grace...). Pasmens, son pas forçadament utilizats per totes los espleches. D'unes, coma lo traductor automatic Apertium, an lor pròpri jòc d'etiquetas. En mai, la màger part dels estandards prenon pas ne compta las especificitats pròpria a l'occitan, coma los enonciatius gascons.

Lo Congrès a donc desvolopat un jòc d'etiquetas de categorias gramaticalas adaptat a la lenga occitana, interopérable amb los estandards internacionals e los espleches TAL liures de dreches los mai utilizats.

"un jòc d'etiquetas a 3 nivèls"

Aquel jòc d'etiqueta fonciona amb 3 nivèls :

  • la categoria generala, correspondent al PoS (Part of Parladissa) que partejan en general un lema e sas formas plegadas : « Adj » per adjectiu, « Vèrb » per vèrb...
  • la categoria detalhada, correspondent al PoS + las informacions morphosyntaxiques (genre, nombre, informacions de conjugason...) : « AdjMS » per adjectiu masculin singular, « VerbeIndPres1s » per vèrb a la 1e degun del singular del present de l'indicatiu...
  • dins d'autres lexics, sustot los a destinacion del maquina learning, se pòt ajustar una etiqueta mai generala de familha gramaticala qu'amassa las categorias generalas avent un foncionament plan similar : « Det » amassa los determinants demostratius, exclamatius, indefinits, interrogatius, possessius, relatius e definits.

L'utilizacion d'aquel jòc d'etiqueta per totas las ressorsas del Congrès permet de los tornar interopérables. Un mot dins un còrpus de tèxt a la meteissa etiqueta que dins un diccionari. Per exemple, se s'a dins un tèxt la frasa « son parelh ès grand », l'utilizator pòt clicar sus « sa » e aver la definicion del determinant possessiu « sa » sens riscar d'aterrir sus la definicion del nom comun « un son » (un bruch).

"nivèl de granularité plan fin"

lo jòc d'etiqueta es estat bastit amb un nivèl de granularité plan fin. Permet de distinguir, per exemple, un préadverbe coma « se » (que pòt pas èsser utilizat que davant un adjectiu o un advèrbi), d'un advèrbi coma « fòrça » (que pòt èsser utilizat sol). O encara lo pronom personal « nòstres » (« nosautres ») emplegat coma pronom tonic (« pensar a nosautres ») o coma COD antepausat (« nos agacha »).

Descripcion del jòc d'etiquetas

Presentation del jòc d'etiquetas e descripcion de las categorias.

Veire lo document

Lista de categorias

Tabulari de las categorias detalhadas e generalas amb lors denominacion.

Veire lo document

Ne saber mai

Formatage TEI

Lo Congrès utiliza la nòrma TEI dins l'encastre de son projècte Lexics, qu'a per tòca de formatar totes sos lexics

Veire la pagina

Codes IANA de varietats

Codes estandardizats per tal d'identificar las lengas, lors varietats, lors grafias e lors alfabets.

Veire la pagina

Etiquettes de POS

Jòc d'etiquetas gramaticalas adaptat a la lenga occitana.

Veire la pagina