Corrector (informatic)

Un article de Wikipédia, l'enciclopèdia liura.
Corrector ortografic de Firefox

Un corrector es, en informatica, un esplech logicial permetent d'analisar un tèxt per tal de detectar, e eventualament de corregir, las fautas d'ortografia e los clòsques que conten.

Descripcion[modificar | modificar lo còdi]

Cal pas confondre lo corrector ortografic e lo corrector gramatical (egalament apelat verificator gramatical). Lo corrector ortografic compara los mots del tèxt als mots d'un diccionari. Se los mots del tèxt son dins los diccionaris, son acceptats, senon una o mantuna proposicion de mots pròches es facha pel corrector ortografic. Lo corrector gramatical verifica que los mots del tèxt, malgrat que sián dins los diccionaris, son confòrms a las règlas de gramatica (acòrdis, òrdre dels mots, etc.) e a las règlas de la semantica (frasa avent un sens, abséncia de confusion d'omofòns , etc.).

Aquel logicial pòt èsser autonòm e foncionar sus un blòc de tèxt brut, mas la foncion de correccion es sovent integrada dins los logicials ont l'utilizator es menat a sasir de tèxt. L'es estada al començament dins los logicials de tractaments de tèxt e uèi dins los fòrums, los gestionaris de corric, dins los navigators web.

L'analisi se pòt far en temps real, valent a dire a mesura que l'utilizator sasís lo tèxt, las errors essent alara formatadas d'una faiçon diferenta per tal d'atirar son atencion e l'incitar a corregir, amb las proposicions de correccion dins un menut contextual, o plan en un sol còp, a la demanda de l'utilizator. Los logicials de tractament de tèxt dispausan tanben d'una foncion de correccion automatica paramétrable tractant las fautas e las abreviacions a cada validacion del mot redigit, en foncion d'una taula de correspondéncia.

L'utilizator pòt èsser menat a completar lo diccionari integrat per defaut, en ajustant sustot los noms pròpris, per tal d'evitar los falses positius.

Especificitats de las lengas[modificar | modificar lo còdi]

L'anglés es una excepcion en aquel sens que la màger part dels mots utilizats a l'escrich an pas qu'una sola escritura que pòt èsser trobada dins un diccionari estandard, a l'excepcion de d'unes girgons e mots modificats. Mentretant dins las lengas flexionalas, los mots son sovent menats a adaptar lor ortografia als mots vesins. Per exemple, en francés lo mot « ieu » seguit de qual que siá mot començant per una vocala es totjorn escrich jos sa forma élidée, coma dins « ai » o « anarai ». En alemand, los noms compausats son sovent tirats d'autres noms existents. D'unas escrituras separan pas clarament los mots los unes dels autres, çò que necessita dels algoritmes de separacion de mots. Cada lenga pòt donc presentar de desfises distints pels correctors ortografics de lengas non anglesas.

Novèla ortografia francesa de 1990[modificar | modificar lo còdi]

Dempuèi la reforma de 1990, la lenga francesa coneis la coexisténcia de doas ortografias distintas per d'unes mots[1].

Lo corrector de la seguida Ofici de Microsoft dispausa de tres mòdes de foncionament : utilizacion de l'ortografia anciana, utilizacion de l'ortografia novèla, acceptacion de las doas ortografias[2].

Lo corrector de la seguida burotica Openoffice.org, e de sas derivadas (apacha OpenOffice, LibreOffice), dispausan de quatre diccionaris : lo « Modèrn », lo « Classic », lo « Reforma 1990 » e lo « Totas variantas »[3].

Lo corrector Lo Robert dispausa de dos mòdes de foncionament : anciana ortografia e novèla ortografia.

Lo corrector logicial Antidòt dispausa de tres mòdes de foncionament : correccion per l'ortografia anciana, correccion per l'ortografia novèla, acceptacion de las doas ortografias[4].

Lo corrector Cordial de Sinapsi desvolopament es a jorn de l'ortografia novèla dempuèi 2003[5].

Jos Debian, existís quatre variantas del diccionari hunspell : hunspell-fr-classical (version classica), hunspell-fr-comprehensive (version complèta), hunspell-fr-modern (version modèrna), hunspell-fr-revised (version revisada).

Sensibilitat al contèxt[modificar | modificar lo còdi]

Las darrièras recèrcas se son focalizadas sul desvolopament d'algoritmes capables de reconéisser un mot mal escrich, quitament quand lo mot es dins lo diccionari, en se basant suls mots a l'entorn. Aquò tempèra l'efièch desastrós ligat a l'extension dels diccionaris e permet a mai de mots d'èsser reconeguts. L'exemple mai corrent del genre d'error qu'aquel sistèma pòt detectar es l'error d'omonimia , coma dins la frasa seguenta : Illa son las per eles son aquí.

L'algoritme de correccion ortografica lo mai eficaç del moment es l'algoritme repausant sus la tecnica del ventatge[6] publicat en 1999 per Andrew Golding e Dan Roth : es capable de reconéisser mai o mens 96 % de las errors ligadas al contèxt, en mai de detectar los non-mots (respècte al diccionari)[7]. Las darrièras versions dels correctors gramaticals son sensiblas al contèxt. Gràcias a l'analisi de gròs còrpus, dispausan de contèxt abitual dels mots mai corrents e pòdon atal corregir de fautas d'omonimia (coma « daissa » e « lache » o « vent » e « van ») amb una bona precision. Es lo cas d'Antidòt , qu'a analisat un còrpus de 500 milions de mots, es tanben lo cas de Cordial, qu'a analisat un còrpus de 1 miliard 200 milions de mots, e del corrector Robert.

Qualques correctors[modificar | modificar lo còdi]

Ortografics solament[modificar | modificar lo còdi]

Gramaticals[modificar | modificar lo còdi]

  • Antidòt (proprietari).
  • Lo Robert (proprietari), de las societats Lo Robert e Edicions Diagonal.
  • Corrector 101 (proprietari).
  • NeuroSpell (proprietari), de la societat cubAIx

Ortograficas, gramaticals e d'estil[modificar | modificar lo còdi]

Nòtas e referéncias[modificar | modificar lo còdi]

  1. « • www.orthographe-recommandee.info : informacions sus las rectificacions de l'ortografia francesa (« novèla ortografia » o « ortografia rectificada ») », sus www.orthographe-recommandee.info (consultat lo ).
  2. « lo novèl corrector ortografic francés d'Ofici 2003 e la reforma de l'ortografia », CorrecteurOrthographiqueOffice,‎ (lira en linha, consultat lo ).
  3. « Diccionaris ortografics (Consultar lo subjècte) • Fòrum OpenOffice LibreOffice NeoOffice », sus forum.openoffice.org (consultat lo ).
  4. « • www.orthographe-recommandee.info : informacions sus las rectificacions de l'ortografia francesa (« novèla ortografia » o « ortografia rectificada ») », sus www.orthographe-recommandee.info (consultat lo ).
  5. « Logicials », sus gqmnf.org (consultat lo ).
  6. En anglés, winnow-based spelling correccion algorithm.
  7. (en) A Winnow-Based Approach to Context-Sensitiva Spelling Correccion - Golding, Roth (ResearchIndex).
  8. « • www.orthographe-recommandee.info : informacions sus las rectificacions… », sus orthographe-recommandee.info (consultat lo ).

Veire tanben[modificar | modificar lo còdi]

Articles connèxes[modificar | modificar lo còdi]