Traduccion automatica

Un article de Wikipédia, l'enciclopèdia liura.
Traduccion automatica en realitat aumentada: la scèna filmada «Bienvenido al futuro» en espanhòl es automaticament traducha e corrèctament tornada «Welcome to the futura» en anglés sus l'ecran d'enquadrament e de visionnage
Tèxtes non comprensibles produches per una traduccion automatizada
Chinés incorrècte « 沒有進入 » eissit d'una traduccion automatizada a Bali en Indonesia. La frasa incorrècta significa «existís pas de dintrada» o «sètz pas encara dintrat», mentre que la frasa anglesa «no entry» (literalament, pas de dintrada) vòl significar «dintratz-pas»

La traduccion automatica designa la traduccion bruta d'un tèxt, entièrament realizada per un o mantun programa informatic. Dins lo cas de la traduccion d'una conversacion audio, en dirècte o en diferit, se parla de 'transcripcion automatica'.

Un traductor uman interven pas per corregir las errors del tèxt pendent la traduccion, mas solament abans e/o après. Se la distinguís de traduccion assistida per ordenador, ont la traduccion es en partida manuala, eventualament de faiçon interactiva amb la maquina.

Malgrat sas feblesas, pòt tornar dels servicis dins de domenis tals coma la velha internacionala (e mai la velha tecnologica)[1], ont permet de prene coneissença de faiçon superficiala, mas rapida, de grandas quantitats de tèxtes.

Dempuèi la debuta del sègle, la traduccion automatica coneis una aviada considerabla sul Web, amb mantun sistèma en linha podent traduire automaticament, e en qualques segondas, de las paginas Web o dels tèxtes de mai en mai longs.

Es una ajuda plan apreciada del public grand, perque permet de deschifrar — de faiçon grossièra — lo tèma d'una pagina Web dins una lenga totalament desconeguda e los principals faches o elements d'informacion que conten. Per simplificar la navigacion, mantun motor de recèrca coma Google, Altavista o Yahoo! prepausan de l'utilizar sistematicament.

Istòria e evolucions[modificar | modificar lo còdi]

A , la premsa anóncia de notables melhoraments[2]. Lo Centre internacional per las tecnologias avançadas de las comunicacions, dirigit conjonchament per l'universitat Carnegie-Mellon de Pittsburgh e l'universitat de Karlsruhe en Alemanha, desvèla alara un sistèma informatic de traduccion instantanèa.

Un estudiant chinés, vestit d'onze electròdes sus la cara e sus la garganta, pronóncia dins sa lenga un discors qu'es simultanèament traduch en anglés e en espanhòl. Los cercaires indican en conclusion que « los resultats son pas perfièches » e que « i pòt aver de dificultats de còps ». En fach, cap d'article indica pas que los jornalistas alemands e americans s'an pogut entretenir amb l'estudiant. Los jornalistas ometon d'autre biais generalament de precisar que, quand lo doctor Waibel anóncia que va prene de questions de jornalistas alemands e americans, l'ordenador ausís quicòm coma : « Atal nosautres glicogèn el alternant de questions entre Alemanha e America. »[3] Aquel tip de traduccion instantanèa manca encara de melhoraments logicielles pertocant la reconeissença vocala, sustot desavenguda pel bruch ambient e la marrida prononciacion.

En 2018, un esplech informatic basat sus l'intelligéncia artificiala capitèt a traduire en dotze oras un libre de 800 paginas de tèxt, de grafics e de formulas matematicas, escrich amb LaTeX[4]. Aquel esplech desvolopat per Quantmetry, una entrepresa jove de conselh en intelligéncia artificiala per las entrepresas, associada a quatre cercaires franceses especialistas de l'aprendissatge prigond e eissits de l'ENSAI , de l'INRIA e de l'Universitat de Can, es basat sul servici de traduccion automatica DeepL.

La traduccion automatica basada sus l'aprendissatge prigond es apelada traduccion automatica neuronala, o NMT en anglés ("Neural Engenha Translacion")[5].

En 2019, l'un dels servicis menaire del domeni es DeepL de Linguee, mas aquel servici poiriá èsser davançat per de progrèsses a venir de Google[6].

En 2010, Pangeanic ven la primièra entrepresa al mond a aplicar lo traductor estatistic Moses dins un environament comercial en desvolopant una plataforma d'autoapprentissage, de netejatge de còrpus e de reciclatge, en collaboracion amb l'Instituto Técnico d'Informática de València (ITI) e lo grop de recèrca Reconeissença de las formas e tecnologia del lengatge uman de la Politècnica de València. Membre fondator de TAUS, Pangeanic empòrta lo mai grand contracte d'infrastructura de traduccion automatica per la Comission europèa amb son projècte IADAATPA en 2017. Dempuèi 2019, Pangeanic dirigís Nteu.eu, un projècte CEF de la Comission europèa. NTEU es la mai granda bòria de motors de traduccion automatica fondada sus las rets neuronalas per las administracions publicas europèas.

Dempuèi 2020, Google a automatizat la traduccion de discors o de conversacion orala accessibla dempuèi de telefòns mobils[7].

Traduccion automatica e transcripcion automatica[modificar | modificar lo còdi]

La traduccion automatica se distinguís de la transcripcion automatica pel fach que la traduccion automatica es una traduccion — d'escrich cap a l'escrich — mentre que la transcripcion s'aplica sus un discors e pòt èsser prepausada de faiçon escricha[8].

Per exemple, lo centre de traduccion dels organs de l'UE prepausa a sos utilizators los dos tips de servicis per lor permetre d'obtenir lèu e a mendres fresc un tèxt utilizable sens èsser precisament just[8].

Lo primièr distributor de film indian — originalament per VHS —, amb mantuna centena de milions d'utilizators enregistrats, conegut per sos films blockbusters[9] a fach sostitolar — transcriure automaticament — l'integralitat de las 12 000 produches de son catalòg pel servici de Google per los rendre disponibles en lenga araba. Aquela transcripcion automatica redutz los còstes de 25 % e los delais de dos jorns. Condutz tanben a d'errors que necessitan de las correccions quand son detectadas o identificadas[10].

Lo procediment de traduccion[modificar | modificar lo còdi]

Triangle de Vauquois, modèla pels fondaments de la traduccion automatica

Lo procediment de traduccion (al sens uman) pòt èsser copat en tres fasas :

  1. Compreneson : assimilacion del sens veïculat per un tèxt, de voler dire d'un autor ;
  2. Déverbalisation : oblit dels mots e conservacion del sens ; « Operacion per la quala un subjècte pren consciéncia del sens d'un messatge en perdent consciéncia dels mots e de las frasas que li an balhat còs »[11] ;
  3. Réexpression : reformulacion del voler dire en lenga cibla.

En tèrmes informatics, la compreneson ven l'analisi , la déverbalisation ven lo transferiment e la réexpression ven la generacion. Aquelas etapas del procediment son modélisées dins lo triangle de Vauquois[12]. Aquel modèl es util, perque per passar de font a la cibla, existís mantun camin possible que constituïsson los diferents apròchis considerats a aquel jorn. Mai lo gra de conceptualizacion es naut, mai cort es lo camin del transferiment. Existís quatre possibilitats principalas :

  • Lo transferiment dirècte : pas de conceptualizacion, tota la traduccion pausa sul transferiment. La traduccion per l'exemple e la traduccion estatistica[13] trabalhan a aquel nivèl. La traduccion es vista coma un procediment de décodage.
  • Lo transferiment sintaxic : lo nivèl del transferiment es sintaxic. Generalament, sa representacion es l'arbre sintaxic. L'analisi produtz una representacion sintaxica per la lenga sorsa. Lo transferiment consistís a produire una representacion sintaxica per la lenga cibla a partir d'aqueste. Fin finala, la generacion produtz la frasa en lenga cibla. La traduccion automatica a basa de règlas es representativa d'aquela categoria. Las règlas permeton las diferentas transformacions.
  • Lo transferiment semantic : lo nivèl del transferiment es semantic. Aquela via es la que manlèvan los umans. Los modèls de representacion de la semantica del lengatge son descriches per la pragmatica. La semantica pòt èsser descricha per una ontologia. I a pas que pauc d'apròchis de la traduccion automatica representativas del transferiment semantic[14].
  • L'interlangue  : Aquel nivèl suprimís la necessitat de transferiment. L'interlangue , egalament designada pel tèrme de lenga pivòt, ven universala. E sols demòran los procediments d'analisi e de generacion. DLT (veire l'article Traduccion de lengas distribuïda) es una temptativa inacabada d'aquel apròchi. Lo lengatge UNL es tanben un exemple de lengatge formal informatic permetent de representar lo sens d'un enonciat. L'apròchi es sedusent, perque l'esfòrç consistís, per una lenga balhada, a produire un analisaire e un generator per l'interlangue. Se benefícia alara de totas las traduccions d'o cap a las lengas possedissent tanben l'analisaire e lo generator. Aquel apròchi demòra dificil e a pas conegut de capitada a larja escala.

Actualament, los motors de traduccion son principalament per règlas o estatisticas. Una via dicha ibrida emergís[15]. Systran, Google Translate, Reverso e Microsoft Traduccion utilizan d'apròchis ibrids.

Prérequis[modificar | modificar lo còdi]

Los prérequis dependon de l'apròchi considerat : traduccion a basa de règlas (mot-a-mot, transferiment, pivòt), traduccion per l'exemple, traduccion estatistica.

La traduccion automatica a basa de règlas necessita :

La traduccion per l'exemple e la traduccion estatistica necessitan :

Se pòt, en mai, aver besonh d'espleches d'analisi lingüistica tals coma :

  • los identificadors (tokens),
  • l'étiqueteur morphosyntaxique,
  • eventualament, un segmenteur (chunker), un analisaire sintaxic (parser).

Apròchis[modificar | modificar lo còdi]

Un esquèma mai complèt del triangle de Vauquois, illustrant los apròchis possibles per la concepcion de sistèmas de traduccion automatica.

Mantun apròchi pòt èsser consideradas per la traduccion automatica[16].

  • Apròchi dirècte :
  1. traduccion mot-a-mot del tèxt sorsa cap al tèxt cibla
  2. reformulacion de l'òrdre dels mots traduches dins lo tèxt cibla
  3. traduccion literala d'un tèxt a partir d'una fòto
  • Apròcha Interlangue :
  1. construccion de la representacion interlangue del tèxt sorsa
  2. construccion del tèxt cibla per la representacion
  • Apròcha per transferiment :
  1. analisi lexicala e sintaxica del tèxt sorsa
  2. transferiment dels lemas traduches e estructuras en lenga cibla
  • Proposicion : Apròchi sequencial (o progressiva) :
  1. Correccion automatica del tèxt sorsa
  2. Tractament de las expressions idiomaticas
    1. Deteccion de las expressions idiomaticas en lenga sorsa dins lo tèxt sorsa
    2. Interpretacion en lengatge cibla
    3. Traduccion mot-a-mot en lengatge sorsa
    4. Remplaçament dins lo tèxt sorsa
  3. Deteccion per interpretacion (lenga sorsa → lenga cibla e traduccion mot-a-mot → lenga sorsa) e remplaçament dels sols noms pròpris dins lo tèxt sorsa
  4. Reorganizacion sintaxica dins lo tèxt sorsa
  5. Traduccion mot-a-mot del tèxt sorsa

Notorietat[modificar | modificar lo còdi]

L'usatge de la traduccion automatica es vengut corrent per d'unes escambis e dins d'unes miègs professionals[17].

Per exemple, en despièch dels risques e en l'abséncia de professionals competents, los espitals e clinicas dels Estats Units poirián recórrer a la traduccion automatica[18].

Environ 90 % dels tèxtes traduches per la Direccion generala de la Traduccion (DG TRAD) son prat-traduches per traduccion automatica[19].

Qualitat de la traduccion[modificar | modificar lo còdi]

La traduccion automatica, bruta, es pas perfiècha, e qualques errors se pòdon trobar dins lo resultat, coma l'utilizacion d'un mot en plaça d'un autre. Necessita donc d'èsser retravaillée per eliminar las errors. La revision umana de la traduccion automatica es apelada la pòst-edicion. Quand lo quantitatiu e lo còst prèmian sul qualitatiu, la traduccion automatica es privilegiada e lo traductor professional se tròba de còps obligat de justificar sa plusvalua[20].

La qualitat de las traduccions es mentretant aumentada per la pòst-edicion. Un estudi sus un sistèma de traduccion automatizada utilizada dins una agéncia de premsa canadiana a revelat que la pòst-edicion per de redactors umans a corregit de nombrosas errors comesas per la maquina, mas pas totas[21]. Exemple d'error ont lo mot mandat es traduch literalament, sens tenir compte del contèxt de las mesuras sanitàrias ligadas a la pandemia de COVID-19:

Tèxt original en anglés Traduccion automatica en francés Pòst-edicion per un uman
And now most mandatas

ara lifting.

E ara, la màger part dels

mandats son levats.

E ara, l'obligacion d'o portar [la masca]

es levada a mantun endrech al país.

Mesura de la qualitat[modificar | modificar lo còdi]

De las metricas de mesura de la qualitat son utilizadas per poder automatizar la mesura de la qualitat de la traduccion automatica. Demest las metricas conegudas se tròban BLAU, ROG, NIST e METEOR[20].

Avaloracion umana[modificar | modificar lo còdi]

La traduccion automatica pòt egalament far l'objècte d'una classificacion umana :

  • classament de las traduccions segon lor fidelitat a las fonts
  • quantitat de pòst-edicion necessària
  • classificacion dels tips d'errors identificadas (errors lexicalas, sintaxicas ; apondis, omissions ; òrdre dels mots sustot)[20].

La qualitat de la traduccion pòt èsser exprimida per son utilitat per la pòst-edicion, en tèrmes de ganh de temps respècte a una traduccion sens prat-traduccion automatica[22]. D'unes estudis mòstran que lo temps de produccion d'un tèxt tradutz amb recors a una traduccion automatica pòst-editada es tres o quatre còp mendre que sens recors a la TA[22]. D'autres estudis nuançan aquò per la l'impacte de la proximitat terminologica entre la lenga sorsa e la lenga cibla, amb las lengas avent un lexic mai distant de la font necessitant mai te temps de pòst-edicion[23].

Risques[modificar | modificar lo còdi]

Aquel tip de servici pòt presentar de risques dins lo domeni de la vida privada, aital coma de risques d'indusir de prejutjats racistas o sexistas[24].

Un marrit usatge pòt conduire a d'autres risques segon l'usatge, atal segon lo Daily Telegraph, un emplegat polonés es estat seriosament nafrat après aver seguit las consignas de securitat dont Google aviá balhat una traduccion incorrècta o erronèa a la demanda de l'emplegaire — Parker's Nurseries —[25].

Saber-far[modificar | modificar lo còdi]

Lo saber utilizar amb la reculada necessària la traduccion automatica s'apèla “Maquina Translacion Literacy”.

Aplicacions[modificar | modificar lo còdi]

Los aparelhs de traduccion actuals son utils per de situacions limitadas, per exemple, per reservar una cambra dins una ostalariá. « se vau a Pequin, pòdi davalar al Hilton sens cap de problèma », disiá Stephan Vogel, un cercaire de Carnegie Mellon.

Servicis en linha[modificar | modificar lo còdi]

Los servicis en linha son d'aparéncia simpla a utilizar : consistisson a obrir lo servici, copiar automaticament lo tèxt a traduire, causir la lenga d'origina e la lenga de destinacion puèi demandar la traduccion[24].

Traductors en linha gratuits :

Permeton de traduire dels mots o dels tèxtes de talha limitada. S'agís, per exemple, de :

Logicials liures :

Environaments de desvolopament :

Lengas ancianas[modificar | modificar lo còdi]

Los progrèsses de las rets neuronalas convolutifs pendent las darrièras annadas e de la traduccion automatica a febla ressorsa (quand sola una quantitat plan limitada de donadas e d'exemples son disponibles per la formacion) an permés la traduccion automatica per las lengas ancianas, talas coma l'accadian e sos dialèctes babilonian e assirian[26].

Prospectiva[modificar | modificar lo còdi]

Divèrses projèctes cercan de melhorar los resultats e la rapiditat dels motors de traduccion (dont lo de Google), esperant un jorn poder dominar la « barrièra de la lenga » e traduire en temps real (coma aquò es estat imaginat per de nombroses autors de sciéncia-ficcion) una lenga estrangièra, quitament poder « comunicar » amb d'unes animals per un logicial de tractament vocal.

  • Un projècte en cors a Japon consistís a equipar un telefòn mobil d'un traductor multilingüe automatic. Aquel projècte mira dins un primièr temps a afichar sus l'ecran del telefòn la traduccion de frasas e mots simples prononciats en japonés o en d'autras lengas, en qualques segondas e de faiçon autonòma, valent a dire sens dependre d'un servidor[27].

Nòtas e referéncias[modificar | modificar lo còdi]

  1. Laurence Danlos. Professor de Lingüistica Informatica a l'Universitat París 7, escrich dins Lingüistica informatica, Traduccion automatica : « Produson sovent de traduccions erronèas mas que pòdon almens servir a determinar de qué parla lo tèxt (çò qu'es important en velha tecnologica, per exemple). »
  2. « De novèls sistèmas de traduccion per dominar la barrièra de la lenga », sus www.rtflash.fr, (consultat lo )
  3. Ange-Gabriel C., « Una maquina de traduccion simultanèa », sus generation-nt.com, (consultat lo )
  4. Laure Beaudonnet, « «Deep learning»: L'òme pren sa primièra gròssa rosta per la maquina en matèria de traduccion », sus www.20minutes.fr, (consultat lo )
  5. « la traduccion automatica fa de passes de gigant », sus lesechos.fr (consultat lo )
  6. Anouch Seydtaghia, « Traduccion: DeepL es lo melhor, mas Google innovarà lèu », Lo Temps,‎ (lira en linha, consultat l'11 ).
  7. https://www.science-et-vie.com/science-et-culture/traduction-automatique-la-barriere-de-la-langue-est-en-train-de-tomber-58230
  8. a e b « cdt.europa.eu/fr/news/nouveaux… »(Archive.orgWikiwixArchive.isGoogleQue far ?).
  9. Cheeni Kum, Happy Bhag Jayegi, Manmarziyaan, Bajirao Mastani, Tanu Weds Manu Returns, Goliyon ki raasleela Ram-Leela, Rockstar, Shubh Mangal Savdhan, Vicky Donor, Mukkabaaz, Munna Michael, Ki & Ka, English Vinglish, Sellvandhan, Zindagi Virat Hain, Maine Pyaar Kiya and Padosan
  10. https://www.moneycontrol.com/news/trends/entertainment/changing-script-ai-not-humans-to-write-subtitles-for-movies-soaps-6632641.html
  11. La traduccion: mòde d'emplec, Glossari analitic, J. DEMANUELLI & C. DEMANUELLI, pagina 51
  12. En seguida de las òbras de Vauquois e Boitet (Bernard Vauquois, Christian Boitet: Automated Translacion at Grenòble University. Computational Linguistics 11(1): 28-36 (1985))
  13. Philipp Koehn: Statistical Engenha Translacion. Cambridge University Press, 2010.
  14. (en) Eugene Seo, El-Sun Song, Su-Kyung Kim, e Hò-Jin Choi. 2009. Syntactic and semantic English-Korean engenha translacion using ontology. In Proceedings of the 11th internacional conference òm Advanced Comunicacion Technology - Volum 3 (ICACT'09), Panatòri. 3. IEEE Press, Piscataway, NJ, USA, 2129-2132.
  15. Roland Raoul KOUASSI, Universitat de Cocody, La problematica de la traduccion automatica, , 30 p. (lira en linha)
  16. M. Constant, Cors de Traduccion automatica, Universitat París-Èst Marna-la-Val, , 32 p.
  17. La traduccion juridica de cap a la traduccion automatica
  18. https://www.presse-citron.net/google-traduction-est-toujours-un-risque-pour-la-medecine/
  19. Rapòrt annal d'activitats, 2015, DG Traduccion, D(2016)3325
  20. a b e c Rudy Loock, « Traduccion automatica e usatge lingüistic : una analisi de traduccions angleses-franceses amassadas en còrpus », Méta, panatòri. 63, no 3,‎ , p.786–806 (lira en linha).
  21. Éric Poirier e Jean-Hugues Roy, « Ultrad: esplech de traduccion de la Premsa Canadiana. La traduccion automatica dins un contèxt jornalistic », Jornada d'estudi Traduccion e jornalisme (Jornada d'estudi Traduccion e jornalisme, Montreal, 7 d'octobre de 2022), jos la dir. de Boulanger, Pier-Pascale e Gagnon, Chantal,‎ (lira en linha [PDF])
  22. a e b Christian Boitet e Hervé Blanchon, « "Promessas e problèmas de la « TAO per totes ». Après LIDIA-1, una primièra maqueta" », Lengatges, panatòri. 28, no 116,‎ , p. 20–47 (DOI 10.3406/lgge.1994.1692, lira en linha, consultat lo )
  23. Ritesh Shah, Christian Boitet, Pushpak Bhattacharyya, Mithun Padmakumar, Leonardo Zilio, Ruslan Kalitvianski, Mohammad Nasiruddin, Mutsuko Tomokiyo e Sandra Castellanos Páez, « Pòst-editing a chapter of a specialized textbook into 7 languages: importància of terminological proximity with English for productivity », Proceedings of the 12th Internacional Conference òm Natural Language Processing, NLP Associacion of India,‎ , p. 325–332 (lira en linha, consultat lo )
  24. a e b Lynne Bowker, « Traduccion automatica : una forma novèla de littératie a l'èra del numeric », sus noslangues-ourlanguages.gc.ca.
  25. Daily Telegraph, febrièr de 2013
  26. (en) Gaujós Gutherz, Shai Gordin, Luis Sáenz e Omer Levy, « Translating Akkadian to English with neural maquina translacion », PNAS Nexus, panatòri. 2, no 5,‎ (ISSN 2752-6542, PMID 37143863, PMCID PMC10153418, DOI 10.1093/pnasnexus/pgad096, lira en linha, consultat lo )
  27. descripcion d'un ensag al C&C iEXPO 09, article d'akihabaranews .

Veire tanben[modificar | modificar lo còdi]

Articles connèxes[modificar | modificar lo còdi]

Bibliografia[modificar | modificar lo còdi]

  • Doug Arnold, Balkan, L., Meijer, S., Humphreys, R.L. Sadler, L. 1993. Maquina Translacion: An Introductory Guida.
  • Paul Bennett. 1994. Translacion Units in Human and Maquina. Babel 40:12-20.
  • Bert Esselink. 1998. A practical guida to logicial localization. John Benjamins.
  • Etnològ. 2001. Languages of the World.
  • W. John Hutchins & Harold L. Somers. 1992.An Introduccion to Maquina Translacion. Academic Press.
  • W.John Hutchins. 2001. Maquina translacion over fifty years. Istòria, Epistemologie, Lengatge XXII-1:7-31.
  • Martin Kay. 1997. The Proper Plaça of Men and Maquinas in Language Translacion. Maquina Translacion 13:3-23.
  • Alan K. Melby. 1995. The Possibility of Language. A discussion of the natura of language with implicacions for human and maquina translacion. John Benjamins.
  • Sergei Nirenburg. 1987. Maquina Translacion: Theoretical and Methodological Eissidas. Cambridge University Press.
  • Jörg Porsiel (éd.): Maquina Translacion. What Language Professionals Need to Know. Bundesverband der Dolmetscher und Übersetzer Weiterbildungs- und Fachverlagsgesellschaft mbH, Berlin 2017, (ISBN 978-3-93843-094-1).
  • Johnatan Slocum. 1988. Maquina Translacion Systems. Cambridge University Press.

Ligams extèrns[modificar | modificar lo còdi]