Lettre de ligason :

Seleccionatz vòstra lenga

Codes IANA

En informatica, s'utiliza de còdis estandardizats per identificar las lengas, lors varietats, lors grafias e lors alfabets. S'agís aquí d'estandards internacionals permetent la compatibilitat entre la sistèmas d'espleitacion, los logicials, los sits web... Per exemple, un sit web multilingüe pòt anar identificar la lenga per manca d'un navigator per tal de prepausar son contengut dins la lenga de l'utilizator. Es possible perque los dos còdis de las lenga (aquel balhant los paramètres del navigator e lo per la lenga de la pagina web) son los meteisses.

Los « etiquetas d'identificacion de las lengas IETF » son estadas desvolopadas per l'Internet Engineering Task Force a partir de las nòrmas ISO. Son amassadas dins un registre gerit per l'IANA (Internet Assigned Numbers Authority) dins los quals los conceptors de logicials o de sits web van cercar los còdis necessaris per lors desvolopaments.

Aquelas etiquetas son constituïdas dels sòus-etiquetas (subtags) seguentas :

  • Una jos-etiqueta de lenga obligatòria, sus doas o tres letras, basada sus la nòrma ISO 639. Per l'occitan es « òc ». Se'n pòt pas cambiar perque es enregistrat definitivament.
  • Una a tres jos-etiquetas d'extension de lengas, facultativas, sus 3 letras. Son utilizadas per las macrolangages (èx. : arab, chinés), mas son pas d'ara enlà mai recomandadas.
  • Una jos-etiqueta de sistèma d'escritura, opcionala, sus 4 letras, eissida de la nòrma ISO 15924. Per l'alfabet latin, es « Latn ».
  • Una jos-etiqueta de region, opcionala, sus doas letras majusculas. Correspond a un Estat oficial  e es basada sus la nòrma ISO 3166-1.
  • Una o mantun sòu-etiquetas de varietat, opcionala, sus 5 a 8 caractèrs. Servisson a codar de variantas dialectalas o ortograficas especificas a una lenga.
  • Una jos-etiqueta d'extension, opcionala, sus una letra. Es pauc utilizada. N'i a una, per exemple, que servís a encoder lo format de data.
  • Una jos-etiqueta eventuala d'extension d'utilizacion privada, la letra x seguida de 1 a 8 caractèrs, que cadun pòt utilizar per indicar, per exemple, de las variantas pas normalizadas o d'autras menas de donadas.

La procedura

"Dels còdis estandards, internacionals per prene
en compte la varietat intèrna de l'occitan
dins lo desvolopament informatic"

Abans 2018, existissiá pas d'indicacion normalizada de las varietats de l'occitan balhant los logicials. L'occitan aranés èra, a l'acostumat, diferenciat pel còdi « òc-ÈS » (jos-etiqueta de lenga seguida de la jos-etiqueta de país) e lo demai èra encodé en « òc-FR ». Per respondre a las demandas dels desvolopaires per poder encoder las varietats geograficas e de la grafia per l'occitan, lo Congrès a engatjat una demarcha per en vista d'ajustar los còdis estandards internacionals per tal de prene en compte la variacion intèrna de l'occitan dins lo desvolopament informatic.

Per aquò far lo Congrès a realizat una enquèsta près dels actors desvolopant d'espleches o ressorsas  informaticas per l'occitan. Faguèt atal l'inventari dels besonhs en jos-etiquetas per l'occitan. Aquela lista aviá pas per tòca principala de correspondre a una vertat o a una exaustivitat lingüistica. Son objectiu èra de cobrir los besonhs informatics e applicatifs de diferenciacion de varietats e de jos-varietats. Per exemple existissiá un besonh de poder diferenciar l'aranés en mai del gascon per desvolopar de traductors automatics mai eficaces, mas i aviá pas, a aquel moment, de logicial informatic qu'aja besonh de diferenciar lo lengadocian oriental del lengadocian occidental.

Una primièra lista foguèt atal establida per cobrir los besonhs applicatifs recensats. Lo Congrès depausèt los sòus-etiquetas per 10 varietats e jos-varietats e per 3 grafias de l'occitan, acompanhadas de lor bibliografia justificativa. Las demandas foguèron acceptadas e las jos-etiquetas son désormaisintégrées al registre de l'IANA.

Los sòus-etiquetas

Los sòus-etiquetas (subtags) de varietat e de jos varietat son :

  • auvern : occitan auvernhat
  • gascon : occitan gascon
  • lengadoc : occitan lengadocian
  • limosin : occitan lemosin
  • provenc : occitan provençal
  • vivaraup : occitan vivaroalpenc
  • creiss : varietats del creissent
  • aranes : occitan gascon aranés
  • cisaup : occitan vivaroalpenc cisalpenc
  • nicard : occitan provençal niçard

Los sòus-etiquetas de grafia son :

  • grclass : grafia classica
  • grit : grafia italianizanta
  • grmistr : grafia mistralenca e derivadas (febusiana, Escòla dau Pò)

Se la grafia es pas mencionada dins un jos-etiqueta, lo tèxt/logicial es supausat èsser en grafia classica. S'un tèxt es dins una grafia non normalizada, lo Congrès preconiza d'utilizar un còdi que n'es pas depausat a l'IANA, « grautres » seguit, se besonh, d'una sòus-etiqueta d'extension d'utilizacion privada (-x) seguida d'una numerotacion.

Qualques exemples :

  • Per un tèxt en occitan provençal en grafia mistralenca : òc-provenc-grmistr
  • Per un tèxt en occitan gascon en grafia fébusienne : òc-gascon-grmistr
  • Per un tèxt en occitan lengadocian en grafia classica : òc-lengadoc
  • Per un tèxt en occitan gascon aranés en grafia desconeguda : òc-aranes-grautres (per nosautres)
  • Per un tèxt en occitan auvernhat en grafia classica que cal precisar : òc-auvern-grclass
  • Per un tèxt en occitan provençal niçard en grafia italianisante: òc-nicard-grital
  • Per un tèxt en occitan cisalpin meridional : òc-cisalp qualque part una informacion geografica que precisa qu'es balhant lo sud de la zòna concernida.

Per ne saber mai

Document de presentacion dels còdis de l'IANA

Document explicant las causidas e las preconizacions pels sòus-etiquetas de varietat e de la grafia.

Veire lo document

Podètz tanben consultar lo registre de l'IANA amb totes los còdis de lenga, varietat, sistèma d'escritura...

Ne saber mai

Formatage TEI

Lo Congrès utiliza la nòrma TEI dins l'encastre de son projècte Lexics, qu'a per tòca de formatar totes sos lexics

Veire la pagina

Codes IANA de varietats

Codes estandardizats per tal d'identificar las lengas, lors varietats, lors grafias e lors alfabets.

Veire la pagina

Etiquettes de POS

Jòc d'etiquetas gramaticalas adaptat a la lenga occitana.

Veire la pagina