Aprendissatge supervisat

Un article de Wikipédia, l'enciclopèdia liura.

L'aprendissatge supervisat (supervised learning en anglés) es una tasca d'aprendissatge automatic consistissent a aprene una foncion de prediccion a partir d'exemples anotats, al contra de l'aprendissatge non supervisat. Se distinguís los problèmas de regression dels problèmas de classament[1]. Atal, se considèra que los problèmas de prediccion d'una variabla quantitativa son de problèmas de regression mentre que los problèmas de prediccion d'una variabla qualitativa son de problèmas de classificacion.

Los exemples anotats constituïsson una basa d'aprendissatge, e la foncion de prediccion apresa pòt tanben èsser apelada « ipotèsi » o « modèla ». Se supausa aquela basa d'aprendissatge representativa d'una populacion d'escapolons mai larg e la tòca dels metòdes d'aprendissatge supervisat es de plan generalizar, valent a dire d'aprene una foncion que faga de prediccions corrèctas sus de donadas non presentas dins l'ensemble d'aprendissatge[2].

Definicion matematica[modificar | modificar lo còdi]

Siá , un espaci probabilisé.

Jòc de donadas supervisadas[modificar | modificar lo còdi]

Siá dos espacis mesurables. Se pòt definir una basa de donadas d'aprendissatge (o amassa d'aprendissatge) coma un ensemble de cobles dintrada-sortida ont cada e son de realizacions respectivas de las variablas aleatòrias e . Los cobles de la seguida son independents e identicament distribuïts segon la lei d'un coble a valors dins . Se rampèla qu'aquela lei es caracterizada per una mesura de probabilitat definida per tot eveniment per

Per exemple seguís una lei unifòrma e ont es un bruch centrat. Dins aquel cas, lo metòde d'aprendissatge supervisat utiliza aquela basa d'aprendissatge per determinar una estimacion de f notada g e cridada indistintament foncion de prediccion, ipotèsi o modèla qu'a una dintrada novèla x assòcia una sortida g(x). La tòca d'un algoritme d'aprendissatge supervisat es donc de generalizar per de dintradas desconegudas çò qu'a pogut « aprene » gràcias a las donadas ja anotadas per d'expèrts, aiçò de faiçon « rasonabla ». Se ditz que la foncion de prediccion apresa deu aver de bonas garantidas en generalizacion.

Teoria de la decision[modificar | modificar lo còdi]

Mai generalament[3], l'objectiu de l'aprendissatge supervisat es d'aprene una foncion que « minimiza l'escart entre las variablas aleatòrias e  ». Per definir aquel escart, introdusèm una foncion de pèrda que qüantifica la distància entre una prediccion del modèl e una sortida esperada . A partir d'aquela foncion, podèm definir lo risc estatistic d'un modèl . Es notat e es definit per :

Ne practica, s'a pas jamai accès dirèctament a , en revenge es possible de l'estimar a partir del jòc de donadas en utilizant la mesura empirica definida per tot per .

D'aquí enlà, un algoritme d'aprendissatge supervisat començarà d'algoritmes d'optimizacion per tal de trobar una foncion que minimiza lo risc empiric . Cal notar que es pas res d'autre que la mejana dels escart (al sens de ) entre las prediccions del modèl e las sortidas esperadas.

Classificacion e regression[modificar | modificar lo còdi]

Se distinguís tres tips de problèmas solubles amb un metòde d'aprendissatge automatic supervisada[4] :

  •  : quand la sortida que se cerca d'estimar es una valor dins un ensemble continú de reals, se parla d'un problèma de regression. La foncion de prediccion es alara apelada un régresseur.
  •  : quand l'ensemble de las valors de sortida es acabat, se parla d'un problèma de classificacion, que torna a atribuïr una etiqueta a cada dintrada. La foncion de prediccion es alara apelada un classifieur.
  • Quand es un ensemble de donadas estructuradas, se parla d'un problèma de prediccion estructurada, que torna a atribuïr una sortida complèxa a cada dintrada[5]. Per exemple, en bio-informatica lo problèma de prediccion de rets d'interaccions entre gèns pòt èsser considerat coma un problèma de prediccion estructurada dins la quala l'ensemble possible de las sortidas estructuradas es l'ensemble de totes los grafs modélisant las interaccions possiblas.

Còst qüadratic en regression[modificar | modificar lo còdi]

Una bona estimacion de verificariá . S'estimariá donc per son esperança condicionala respècte a . Lo teorèma[6] segon mòstra l'interès d'utilizar la foncion de pèrda qüadratica dins lo cas d'una regression.

Minimizacion del còst qüadratic — Supausam . Nos provesissèm de la foncion de pèrda qüadratica definida per tot per . Se supausa egalament , amb la mesura de Lebesgue sus . Alara, la foncion que minimiza lo risc estatistic associat a verifica .

Metòdes d'aprendissatge supervisat[modificar | modificar lo còdi]

Aplicacions[modificar | modificar lo còdi]

Nòtas e referéncias[modificar | modificar lo còdi]

  1. « classament » es la traduccion corrècta del tèrme anglés classificacion; la « classificacion » francesa correspond puslèu al clustering en anglés. Veire per exemple la BDL quebequesa
  2. Massih-Reza Amini, « Principis de basa en aprendissatge supervisat », dins Maquina Learning, (lira en linha)
  3. (en) Trevor Hastie, Robert Tibshirani e Jerome Friedman, The Elements of Statistical Learning, Nòva Iòrc, NY, Springer, Nòva Iòrc, NY, (ISBN 978-1-0716-2122-6)
  4. (en) Vladimir Nasteski, « An overview of the supervised maquina learning methods », ORIZONTS.B, panatòri. 4,‎ , p. 51–62 (DOI 10.20544/ORIZONTS.B.04.1.17.P05, lira en linha, consultat lo )
  5. (en) Hal Daumé, John Langford e Daniel Marcu, « Search-based structured prediction », Maquina Learning, panatòri. 75, no 3,‎ , p. 297–325 (ISSN 1573-0565, DOI 10.1007/s10994-009-5106-x, lira en linha, consultat lo )
  6. Sylvain Arlot, « Fondamentals de l'aprendissatge estatistic », dins Aprendissatge estatistic e donadas massisas, Edicions Technip, (lira en linha)

Veire tanben[modificar | modificar lo còdi]

Bibliografia[modificar | modificar lo còdi]

Articles connèxes[modificar | modificar lo còdi]