Vision per ordenador

Un article de Wikipédia, l'enciclopèdia liura.

La vision per ordenador es un domeni scientific e una branca de l'intelligéncia artificiala que tracta de faiçon dont los ordenadors pòdon aquerir una compreneson de naut nivèl a partir d'imatges o de videos numericas. Del ponch de vista de l'engenhariá , cerca de comprene e a automatizar las tascas que lo sistèma visual uman pòt efectuar[1],[2],[3].

Vista d'artista d'un Rover automatic explorant la susfàcia de Mart. Es equipat sus sa cima de doas cameras video li conferissent una vision estereoscopica.

Las tascas de vision per ordenador comprenon de procediments per aquerir, tractar, analisar e « comprene » dels imatges numerics, e tirar de donadas per tal de produire d'informacions numericas o simbolicas, per èx. sòus forma de decisions[4],[5],[6],[7].

Dins aquel contèxt, la compreneson significa la transformacion d'imatges visuals (la dintrada de la retina) en descripcions del mond qu'an un sens pels procediments de pensada e pòdon suscitar una accion apropriada. Aquela compreneson de l'imatge pòt èsser vista coma l'aquisicion d'informacions simbolicas a partir de donadas d'imatge, per l'emplec de modèls s'apuyant sus la geometria, la fisica, las estatisticas e la teoria de l'aprendissatge[8].

La disciplina scientifica de la vision per ordenador s'interèssa a la teoria dels sistèmas artificials que tiran d'informacions a partir d'imatges. Las donadas d'imatge pòdon prene de nombrosas formas, talas coma de sequéncias video, de las vistas de mantuna camera, de las donadas multidimensionnelles a partir d'un escanèr 3D o d'un aparelh de numerizacion medical. La disciplina tecnologica de la vision per ordenador cerca d'aplicar los modèls teorics desvolopats a la construccion de sistèmas de vision per ordenador.

Los jos-domenis de la vision per ordenador comprenon la deteccion d'eveniments, lo seguit video, la reconeissença d'objèctes, l'aprendissatge, l'indexacion, l'estimacion de movement, la modelizacion de scènas 3D e la restauracion d'imatge

Istòria[modificar | modificar lo còdi]

Lo desvolopament de la vision per ordenador a començat dins las universitats pionièras de l'intelligéncia artificiala a la fin de las annadas 1960. L'objectiu èra d'imitar lo sistèma visual uman, primièra etapa per dotar los robòts d'un comportament intelligent[9]. En 1966, se cresiá qu'aquò podiá èsser realizat gràcias a un projècte d'estiu, en estacant una camera a un ordenador e en li fasent « descriure çò que vesiá »[10].

Çò que distinguissiá la vision per ordenador del domeni predominant del tractament d'imatges numerics a aquela epòca èra lo desir de tirar una estructura tridimensionala d'imatges amb la tòca d'arribar a una compreneson complèta de la scèna. D'estudis dins las annadas 1970 an format las primièras basas de nombroses algoritmes de vision per ordenador qu'existisson uèi, e mai l'extraccion dels bòrds d'imatges, l'etiquetatge de las linhas, la modelizacion non poliedrica e poliedrica, la representacion d'objèctes jos forma d'interconnexions d'estructuras mai pichonas, lo flux optic e estimacion de movement[11].

La decennia seguenta a vist d'estudis basats sus una analisi matematica mai rigorosa e dels aspèctes quantitatius de la vision per ordenador. Aquestes incluson lo concèpte d'espaci d'escala, l'inferéncia de la forma a partir de divèrses indicis tals coma lo fulhatge, la textura e la mesa al ponch, e los modèls de contorn coneguts amb lo nom de sèrps. Los cercaires an egalament realizat que bon nombre d'aqueles concèptes matematics podián èsser tractats dins lo meteis quadre d'optimizacion que la regularizacion e los camps aleatòris de Markov[12].

Dins las annadas 1990, d'unes dels tèmas de recèrca precedents son venguts mai actius que los autres. La recèrca sus las reconstruccions projectivas 3D a permés de comprene melhor l'escandalhatge de cameras. Amb l'aveniment dels metòdes d'optimizacion per la calibration de las cameras, nos sèm mainat que de nombrosas idèas èran ja estadas exploradas dins la teoria de l'ajustament dels faissèls dins lo domeni de la photogrammétrie. Aquò a conduch a de metòdes per de reconstruccions 3D éparses de scènas a partir de mantun imatge. De progrèsses son estats realizats sul problèma de la correspondéncia esterèo densa e d'autras tecnicas esterèo a vistas multiplas. Dins lo meteis temps, de las variacions de copa grafica son estadas utilizadas per resòlvre la segmentacion d'imatge.

Aquela decennia a egalament marcat lo primièr còp que de tecnicas d'aprendissatge estatistic son estadas utilizadas dins la practica per reconéisser las caras dins los imatges (veire Eigenface). Cap a la fin de las annadas 90, un cambiament important s'es produch amb l'interaccion acrescuda entre los domenis de l'infografia e de la vision per ordenador. Aquò compreniá lo tornat basat sus l'imatge, l'interpolacion de vista, l'assemblatge d'imatges panoramics e lo primièr tornat de camp luminós .

D'òbras recentas an vist la resurgéncia dels metòdes basats sus las foncionalitats, utilizadas en conjoncion amb de tecnicas d'aprendissatge automatic e dels quadres d'optimizacion complèxas [12],[13], Los progrèsses de las tecnicas d'aprendissatge en prigondor an balhat una vida novèla al domeni de la vision per ordenador. La precision dels algoritmes d'aprendissatge en prigondor sus mantun ensemble de donadas de vision per ordenador de referéncia per de tascas anant de la classificacion, de la segmentacion e del flux optic a subrepassat los metòdes anteriors.

Domenis connèxes[modificar | modificar lo còdi]

Fisica del solid[modificar | modificar lo còdi]

La fisica del solid es un domeni estrechament ligat a la vision per ordenador. La màger part dels sistèmas de vision per ordenador pausan sus de captadors d'imatge, que detèctan lo dardalh electromagnetic, que se presenta generalament jos la forma de lum visible o infrarog. Los captadors son concebuts en utilizant la fisica qüantica. Lo procediment pel qual lo lum interagís amb las susfàcias es explicat en utilizant la fisica. La fisica explica lo comportament de l'optica qu'es al còr de la màger part dels sistèmas d'imatjariá. Los captadors d'imatge sofisticats necessitan la quita mecanica qüantica per fornir una compreneson complèta del procediment de formacion d'imatge[14]. En mai, divèrses problèmas de mesura en fisica pòdon èsser resolguts en utilizant la vision per ordenador, per exemple lo movement dins los fluids.

Neurobiologie[modificar | modificar lo còdi]

Un autre domeni que jòga un ròtle important dins la vision per ordenador es la neurobiologie, en particular l'estudi del sistèma de vision biologica. Pendent lo sègle darrièr, un estudi aprigondit dels uèlhs, de las neurònas e de las estructuras cerebralas es estada consacrada al tractament dels estimulús visuals en çò dels umans e en çò de divèrses animals. Aquò a conduch a una descripcion grossièra, mas complèxa, de la faiçon dont los sistèmas de vision «reals» foncionan per resòlvre d'unas tascas ligadas a la vision. Aqueles resultats an conduch a un jos-domeni de la vision per ordenador ont los sistèmas artificials son concebuts per imitar lo tractament e lo comportament dels sistèmas biologics, a diferents nivèls de complexitat. En mai, d'unas dels metòdes basats sus l'aprendissatge desvolopadas dins l'encastre de la vision per ordenador (per exemple, l'analisi e la classificacion d'imatges e de caracteristicas basadas sus la ret neuronala e l'aprendissatge prigond) an lor experiéncia en biologia.D'unes contravents de la recèrca sus la vision per ordenador son estrechament ligats a l'estudi de la vision biologica - en efièch, tot coma de nombroses contravents de la recèrca sus l'IA son estrechament ligats a la recèrca sus la consciéncia umana e a l'utilizacion de las coneissenças estocadas per interpretar, integrar e utilizar las informacions visualas. Lo domeni de la vision biologica estúdia e modélise los procediments fisiologics darrièr la percepcion visuala en çò de l'òme e d'autres animals. La vision per ordenador, ela, estúdia e descriu los procediments començats dins los logicials e lo material darrièr los sistèmas de vision artificiala. L'escambi interdisciplinari entre la vision biologica e la vision per ordenador s'es averat fruchós dins los dos domenis[15].

Tractament del senhal[modificar | modificar lo còdi]

Un tresen domeni ligat a la vision per ordenador es lo tractament del senhal. De nombroses metòdes de tractament de senhals a una variabla, tipicament dels senhals temporals, pòdon èsser espandidas de faiçon naturala al tractament de senhals a doas variablas o de senhals a variablas multiplas en vision per ordenador. Pasmens, a causa de la natura especifica dels imatges, existís de nombroses metòdes desvolopats dins lo domeni de la vision per ordenador qu'an pas d'equivalent dins lo tractament de senhals a una variabla. Amb la multi dimensionnalité del senhal, aquò definís un jos-camp dins lo tractament del senhal dins l'encastre de la vision per ordenador.

Navigacion robotica[modificar | modificar lo còdi]

La navigacion robotica molzuda de còps de la planificacion de camin autonòm per que los sistèmas robotics naviguen dins un environament[16]. Una compreneson detalhada d'aqueles environaments fa besonh per los córrer. D'informacions sus l'environament poirián èsser fornidas per un sistèma de vision per ordenador, agissent coma un captador de vision e fornissent d'informacions de naut nivèl sus l'environament e lo robòt.

Autres domenis[modificar | modificar lo còdi]

De nombroses metòdes de vision per ordenador son basadas sus las estatisticas, l'optimizacion o la geometria.

Una part importanta del domeni es consacrada a l'implementacion de la vision per ordenador; coma los metòdes existents pòdon èsser realizadas dins divèrsas combinasons de logicials e de material, o coma aqueles metòdes pòdon èsser modificadas per tal de ganhar en velocitat de tractament sens pèrdre tròp de resultats. La vision per ordenador es egalament utilizada dins lo comèrci electronic de la mòda, la recèrca de brevets, los mòbles e l'industria de la beutat.

Aplicacions[modificar | modificar lo còdi]

Las aplicacions van de las tascas talas coma los sistèmas de vision industrials que, per exemple, inspèctan las botelhas que desfilan sus una linha de produccion, a la recèrca sus l'intelligéncia artificiala e los ordenadors o robòts capables de comprene lo mond que los entorneja. Dins de nombrosas aplicacions de vision per ordenador, los ordenadors son préprogrammés per resòlvre una tasca particulara, mas los metòdes basats sus l'aprendissatge son de mai en mai corrents.

D'exemples d'aplicacions de la vision per ordenador comprenon de sistèmas per :

  • Inspeccion automatica, per exemple dins las aplicacions de fabricacion;
  • Ajudar los umans dins las tascas d'identificacion, per exemple, un sistèma d'identificacion de las espècias[17] ;
  • Contraròtle dels procediments, per exemple, un robòt industrial;
  • Deteccion d'eveniments, per exemple per la susvelhança visuala o lo comptatge de personas, per exemple dins l'industria de la restauracion; - Interaccion, per exemple coma dintrada d'un dispositiu d'interaccion ordenador-òme;
  • Modelizacion d'objèctes o d'environaments, per exemple, analisi d'imatges medicals o modelizacion topografica;
  • Navigacion, per exemple per un veïcul autonòm o un robòt mobil; e
  • Organizacion de las informacions, per exemple per l'indexacion de basas de donadas d'imatges e de sequéncias d'imatges.

L'aprendissatge de las formas 3D es estada una tasca dificila en vision per ordenador. Los progrèsses recents de l'aprendissatge en prigondor an permés als cercaires de crear de modèls capables de generar e de tornar bastir de formas 3D a partir de cartas de prigondor o de siloetas a una o mantuna vista de faiçon transparenta e eficaça.

Medecina[modificar | modificar lo còdi]

L'un dels domenis d'aplicacion los mai importants es la vision per ordenador medicala, o tractament d'imatges medicals, caracterizat per l'extraccion d'informacions a partir de donadas d'imatge per diagnosticar un pacient. Se lo pòt utilizar dins la deteccion de tumors, d'arterioscleròsi o d'autres cambiaments fins; las mesuras de las dimensions dels organs, del debit sanguin, etc. ne son un autre exemple. La vision per la recèrca medicala en fornissent de novèlas informacions: per exemple, sus l'estructura del cervèl o sus la qualitat dels tractaments medicals. Las aplicacions de la vision per ordenador dins lo domeni medical incluson egalament lo melhorament dels imatges interpretats per l'òme - imatges ultrasonores o radiographiques per exemple - per reduire l'influéncia del bruch.

Vision industriala[modificar | modificar lo còdi]

Un segond domeni de l'aplicacion de la vision per ordenador es l'industria, de còps apelada vision industriala, ont d'informacions son tiradas amb la tòca de sostenir un procediment de fabricacion. Un exemple es lo contraròtle de la qualitat de produches acabats o a far un trabalh de finalitat amb la tòca de detectar de defauts. Un autre exemple es la mesura de la posicion e l'orientacion de diferents produches qu'an besonh d'èsser sasits per un braç de robòt. La vision industriala es egalament largament utilizada dins los procediments agricòlas per eliminar los aliments de d'unes materials forra-bora, procediment apelat tria optica[18].

Aplicacions militaras[modificar | modificar lo còdi]

Las aplicacions militaras son probablament l'un dels domenis mai importants de la vision per ordenador. Los exemples evidents son la deteccion de soldatas o de veïculs enemics e lo guidatge de missils. De sistèmas mai avançats de guidatge de missil envian lo missil cap a una zòna puslèu qu'una cibla especifica, e la seleccion de la cibla es efectuada quand lo missil atenh la zòna gràcias a de donadas d'imatge aqueridas localament. Los concèptes militars modèrns, tals coma la «consciéncia del prat batalhièr», implican que divèrses captadors, e mai dels captadors d'imatge, fornisson un ensemble ric d'informacions sus una scèna de combat que pòdon puèi èsser utilizadas per prene de decisions estrategicas. Dins aquel cas, lo tractament automatic de las donadas es utilizat per reduire la complexitat e per fusionar las informacions de mantun captador amb la tòca d'aumentar la fisabilitat.

Veïculs autonòms[modificar | modificar lo còdi]

L'un dels domenis novèls d'aplicacion es lo dels veïculs autonòms, que comprenon los submergibles, los veïculs terrèstres (pichons robòts amb ròdas, autos o camions), los veïculs aerians e los veïculs aerians sens pilòt (UAV). Lo nivèl d'autonomia va de veïculs entièrament autonòms (sens pilòt) a de veïculs ont diferents sistèmas basats sus la vision per ordenador ajuda dins d'unas situacions particularas o pilòta o conductor. Los veïculs entièrament autonòms utilizan generalament la vision per ordenador per la navigacion, per èx. per saber ont se tròba, o per produire una carta de son environament (SLAM) e per detectar los obstacles. Pòt egalament èsser utilizat per detectar d'unes eveniments especifics a un domeni particular, per exemple, un UAV a la recèrca d'incendis de bòsc. D'exemples de sistèmas de sosten son los sistèmas d'avertiment d'obstacles dins las autos e los sistèmas d'aterratge autonòm dels aviam. Mantun constructor automobil a fach la demostracion de sistèmas de conducha autonòma d'autos, mas aquela tecnologia a totjorn pas atench un nivèl ont pòt èsser mesa sul mercat. Existís de nombroses exemples de veïculs militars autonòms anant a de missils avançats als drònes per de missions de reconeissença o lo guidatge de missils. L'exploracion espaciala es ja en cors amb de veïculs autonòms utilizant la vision per ordenador, per exemple, Curiosity de la NASA e lo rover Yutu-2 de la CNSA.

Deteccion tactila[modificar | modificar lo còdi]

Dels materials tals coma lo cauchó e lo silici son utilizats per crear de captadors que permeton d'aplicacions talas coma la deteccion de micro-ondulacions e l'escandalhatge de las mans roboticas. Lo cauchó pòt èsser utilizat per tal de crear un mòtle que pòt èsser plaçat sus un det, a l'interior d'aquel mòtle se tròban mantuna mesura de constrencha.

Lo mòtle a det e los captadors poirián alara èsser plaçats sus una fuèlha pichona de cauchó contenent una ret de bròcas en cauchó. Un utilizator pòt alara portar lo mòtle a det e traçar una susfàcia. Un ordenador pòt alara legir las donadas de las mesuras de constrencha e mesurar s'una o mantuna bròca es possada cap amont. S'una espilla es possada cap amont, l'ordenador la pòt reconéisser coma una imperfeccion de la susfàcia. Aquel tip de tecnologia es util per recebre de donadas precisas sus las imperfeccions sus una plan granda susfàcia[19]. Una autra varianta d'aquel captador de muscle de det es de captadors que contenon una camera pendolanta en silici. Lo silici forma un dòma a l'entorn de l'exterior de la camera e dins lo silici s'a de marcadors pontuals que son egalament espaçats. Aquelas cameras pòdon puèi èsser plaçadas sus d'aparelhs tals coma de mans robotizadas per tal de permetre a l'ordenador de recebre de donadas tactilas plan precisas[20].

Autre domenis d'aplicacions[modificar | modificar lo còdi]

  • Presa en carga de la creacion d'efièches visuals pel cinèma e la difusion, per exemple, seguit de camera.
  • Susvelhança.
  • Deteccion de somnoléncia del conductor.
  • Seguit e comptatge dels organismes dins las sciéncias biologicas [21].

Societat[modificar | modificar lo còdi]

Utilizacion de la vision per ordenador per la deteccion de violacions de dreches umans[modificar | modificar lo còdi]

Amb l'utilizacion creissenta dels mèdias socials, la disponibilitat d'internet e l'extension de la cobèrta de la telefonia mobila, la plaça dels mèdias ciutadans dins la documentacion dels crimis de guèrra, de la repression governamentala e mai generalament de las violacions dels dreches de l'òme s'es considerablament agrandida[22].

L'analisi de totes los documents videos e imatges requerís fòrça personal, çò que pòt aver un cout important. Cal tanben notar que las competéncias lingüisticas e las coneissenças culturalas e geograficas pòdon limitar lo nombre de cercaires capables d'efectuar aquela analisi e que pòt èsser émotionnellement dificil d'agachar de videos despenchenant de las scènas de guèrra o d'agressions[23].

Dins la majoritat dels cases, lo trabalh manual dels analistas demòra necessari. Pasmens, las tecnicas de vision per ordenador son de mai en mai utilizadas pels especialistas[24] (per exemple: Carnegie Mellon University Center for Human Rights Sciéncia, Human Rights Watch, Nòva Iòrc University Human Rights Methodology Lab, Carr Center for Human Rights de l'Universitat Harvard,...)

En efièch, aquelas tecnicas ofrisson de possibilitats ineditas. Primièr, la vision per ordenador ofèrta la capacitat de recercar lèu dins de grands volums de videos dels incidents o dels eveniments especifics. Permet per exemple de detectar de nombroses tips d'objèctes qu'interèssan los cercaires en dreches de l'òme coma los elicoptèrs, los avions e autres veïculs militars[25]. Aquela tecnica es egalament en mesura detectar de sons particulars coma de pets o de las explosions.

Puèi, la vision per ordenador permet de comprene melhor las relacions entre diferents incidents gràcias a una analisi globala de grandas colleccions d'eveniments[26].L'utilizacion de la vision per ordenador dins aquel contèxt permet donc als enquestaires de se deure pas prémer una sola video per la compreneson d'un eveniment. Permet tanben d'aumentar la quantitat de donadas utilizadas per plaçar l'eveniment dins son contèxt.

Pasmens, es important de notar que la vision per ordenador pòt pas remplaçar totalament l'activitat umana dins aquel domeni[27],[28]. Bèl primièr, la reconstruccion e l'analisi d'eveniments seràn totjorn limitadas per la qualitat e la quantitat de las donadas. Puèi, lo jutjament uman es important per balhar un sens e un contèxt al trabalh efectuat pel sistèma de vision per ordenador. Un exemple important que soslinha l'importància del jutjament uman es l'analisi de la provenença de las videos[24]. E mai se los algoritmes de vision per ordenador son capables d'analisar de grandas colleccions de videos per evitar la desviacion d'eveniments, cal poder prene en compte lo contèxt d'origina de la video.

Aquel fenomèn es plan present sus las rets socialas ont los actors son generalament pas neutres e an tendéncia a publicar en massa de videos suportant una causa precisa[22].Es donc important de plaçar las accions descrichas dins lor contèxt per los poder plenament comprene. Aquò necessita d'aver d'archius videos complètas e d'utilizar de formas mai tradicionalas de pròvas médico-legalas e de testimoniatges umans. Per exemple, dins los cases de violéncia policièra, es important de conéisser las interaccions anterioras entre los policièrs e las personas concernidas. La capacitat d'analisar de grands volums de videos garantís pas donc pas que la vertat siá descobèrta perque las videos forniguèsson pas totjorn qu'una perspectiva suls eveniments, pas una vista omniscienta o un raconte mèstre[22].

Autos autonòmas[modificar | modificar lo còdi]

Lo foncionament de las autos autonòmas pausa sus la capacitat d'analisi visuala del mièg dins lo qual se desplaçan. Aquela analisi es permesa per de tecnicas de vision per ordenador. L'utilizacion de la vision per ordenador e de las tecnologias connèxas dins aquel domeni lèva mantuna problematica e soslinha l'importància de la responsabilitat dins las decisions presas per de programas informatics assistissent la conducha[29].

En mai de 2016, un automobilista es defuntat al volant d'una Tesla modèla Salors que son auto èra en mòda auto-pilòta[30]. Aquel eveniment tragic es considerat coma lo primièr accident mortal verificat d'una auto en conducha autonòma. L'auto èra pas estada en mesura de detectar un tractor que traversava la rota a un crosament. L'analisi de las donadas fornidas per l'auto, descrivent lo trajècte de l'automobilista abans l'accident an permés de determinar que l'auto rotlava tròp lèu e que lo conductor respondiá a las estimulacions periodicas de l'auto. Las donadas informaticas comprenián pas pasmens cap d'explicacion de las decisions presas pel pilotatge automatic dins los momentons precedissent l'accident o detalhs sus la faiçon precisa dont l'informacion visuala èra estada tractada[31],[32]

Dins un primièr temps, quand un accident de la rota es inevitable, lo sistèma informatic indica, après analisi de l'environament, lo comportament que l'auto deu adoptar. En utilizant las informacions dont dispausa gràcias al sistèma de vision per ordenador (prediccion dels desplaçaments podent menar a de nafras grèvas, trajectòrias blocadas p.ex.), lo programa informatic poiriá èsser menat a causir entre privilegiar la subrevida dels passatgièrs de l'auto o de las personas extèrnas[33]. Aquelas decisions de vida o de mòrt en cas d'accident son centralas dins lo domeni de l'etica dels algoritmes. Constituïsson l'una de las preocupacions de governament principal e rampèlan egalament l'importància de portar un quadre legal ont los constructors e los conceptors pòdon èsser tenguts responsables[34].

Las autos (parcialament) autonòmas son controladas per de sistèmas informatics bastits a l'entorn de divèrsas tecnicas d'aprendissatge coma l'aprendissatge prigond e l'aprendissatge adaptatiu. Las donadas tractadas per aqueles programas son aqueridas per diferents tips de captadors (radar, Lidar, GPS). L'utilizacion extensiva de l'aprendissatge prigond poiriá transferir l'ensemble de las decisions cap a la maquina e tornar la responsabilitat eventuala dels conceptors dels modèls pauc evidenta a provar[35],[36]. S'obsèrva un fenomèn analòg al d'una ranqueja negra, dins la quala la reaccion observada dins una certana situacion es predicha mas l'explicacion precisa del rasonament a l'origina de l'accion demòra opaca[37].

Mantun actor important del mercat de l'automobila implicats dins de projèctes d'automatizacion de la conducha utilizan de combinasons d'estructuras informaticas e logicielles diferentas. Aqueles apròchis distints aital coma los desacòrds tecnics entre los diferents constructors soslinhan l'importància de desvolopar un quadre legislatiu sufisent per definir los estandards relatius a l'integracion de d'unas tecnologias dins lo domeni de la conducha assistida[29].

Un autre enjòc ligat a l'utilizacion de las autos autonòmas es la vulnerabilitat del còdi informatic que regís lo movement de l'auto[38]. S'un tèrç arriba a accedir al còdi informatic, pòt accedir als algoritmes responsables del foncionament e detectar las eventualas feblesas. En 2016, la cadena americana ME-tv anonciava que de piratas informatics avián capitat a modificar lo programa informatic d'una Tesla modèl S[39]. Avián suprimit totes los avertiments que lo sistèma enviava a l'utilizator, indicant entre autres al pilòt de metre sas mans sul volant[40].

Dins l'art[modificar | modificar lo còdi]

Istòria[modificar | modificar lo còdi]

Existís una longa istòria d'utilizacion de l'imatjariá dins l'estudi de l'art[41],[42].Pauc de temps après la descobèrta dels rais X al sègle 19en, aquestes son estats utilizats per revelar de sòus-dessenhs e dels pentimenti. Mai tard, la fotografia infraroja e la réflectographie son estadas esplechadas a de fins similaras. De tecnicas coma l'imatjariá multi-espèctre e l'analisi de la fluorescéncia son utilizadas encara uèi per revelar de caracteristicas de las òbras coma la composicion dels pigments[43],[44]. Istoricament, los imatges resultants produches per aquelas tecnicas aital coma las donadas generadas pels instruments èran analisadas per d'especialistas de l'art[45].

Pendent las darrièras decennias, un certan nombre de cercaires formats en vision per ordenador, en tractament d'imatge, en infografia e en istòria de l'art an desvolopat de metòdes informatics rigoroses per resòlvre un fum de problèmas de l'istòria de l'art.

Se constata que lo recors a l'imatjariá numerica dins l'estudi de l'art es en fòrta creissença[42].

Aqueles metòdes permeton d'estudiar d'unas caracteristicas dificilas a analisar a uèlh nud. An sustot permés de comprene melhor las relacions entre l'estructura dels còps de pincèls e las diferentas escalas e colors dins la Santa familha o de detectar d'anomalias de perspectiva dins lo retrach Arnolfini de van Eyck[46].

La poténcia d'aqueles metòdes informatics proven entre autres dels ponches çai jos:

- Los metòdes informatics utilizan un lengatge objectiu, que permet als especialistas d'art d'ajustar d'elements quantitatius e universals dins lor analisi. Aiçò demesís lo risc d'ambigüitat ligat a l'utilizacion exclusiva de tèrmes subjectius per l'analisi de las òbras[42].

- Permeton de presentar d'angles de vista alternatius de l'òbra gràcias a de procediments d'infografia tridimensionala. Aquel tip de perspectiva pòt pas èsser obtengut qu'amb l'ajuda d'espleches informatics[47].

- Possibilitat d'aquerir una quantitat granda de diferents tips de donadas, fòrça superiora a la qu'es uèi accessibla als especialistas[48].

Los metòdes correntament utilizats dins lo domeni comprenon : las proceduras basadas suls pixèls individuals, las susfàcias, l'analisi de perspectivas, los metòdes de desformacion de l'art corba, l'analisi informatica de l'esclairatge, dels còps de pincèls, de la fendilha, l'analisi grafica simpla e dels metòdes optics[42].

The next Rembrandt[modificar | modificar lo còdi]

Un exemple pro probant de l'utilizacion dels divèrses metòdes de vision per ordenador dins l'estudi de l'art es lo « Next Rembrandt Project »[49].

The Next Rembrandt es un projècte eissit d'una collaboracion entre Microsoft, ING e la TU DELFT qu'aviá per tòca de crear una pintura originala imitant l'estil del pintre Rembrandt Van Rijn en utilizant de tecnicas d'analisi d'imatge de las òbras existentas.

La primièra etapa consistissiá en l'analisi de l'ensemble de las òbras existentas amb l'ajuda de scans tridimensionals a nauta resolucion. Los imatges son estats tractats amb d'algoritmes d'aprendissatge automatic per aumentacion lor resolucion. Aiçò a permés de generar una basa de donadas numericas de 150 giga byte qu'a servit de basa de donadas per la rèsta del projècte.

Après una analisi informatica extensiva de la demografia de las personas representadas dins son òbra , los cercaires an determinat las caracteristicas mai comunas. Las caracteristicas estudiadas comprenián l'orientacion del cap, la preséncia de barba/mostacha, lo tip de vestits e l'edat. Après analisa de basa de las donadas, los cercaires an conclús que lo perfil mai comun èra un òme caucasenc entre trenta e quaranta vestit en negre amb un còl blanc e amb la cara orientada cap a la drecha.

Los cercaires an puèi desvolopat un modèl generant de traches de cara se basant sus las caracteristicas de las òbras de Rembrandt. Las especificitats comprenon l'utilizacion frequenta del contrast entre lo lum e l'escur, lo tip de geometria utilizat pel pintre per representar las caras, la composicion e la geometria del material de pintura. Enfin, après aver generat la pintura en doas dimensions, una analisi del relèu e dels tips de còps de pincèls de las òbras existentas de Rembrandt a permés de recrear una textura similara.

Los cercaires an creat una carta de nautor amb l'ajuda de dos algoritmes diferents qu'an trobat de modèls de textura de las susfàcias de tela e de las jaças de pintura. Las informacions son estadas transformadas en donadas de nautor, çò qu'a permés d'imitar los còps de pincèl utilizats per Rembrandt

Dins lo diagnostic medical[modificar | modificar lo còdi]

Los domenis d'aplicacion principals de la vision per ordenador medicala son la radiologia, la dermatologia, la patologia o l'oftalmologia .

L'introduccion d'aparelhs qu'utilizan d'algoritmes de vision per ordenador dins lo contèxt clinic a levat la question de la responsabilitat legala en cas d'error. D'unes actors soslinhan la necessitat d'adaptar lo quadre legal d'aquel domeni[50]. Las questions levadas concernisson principalament lo contèxt d'utilizacion d'aquelas tecnicas, lor gra d'intervencion o encara las responsabilitats dels diferents actors pendent potencials accidents. Aqueles actors[50] soslinhan l'importància de la transparéncia dels algoritmes que regisson las maquinas de vision per ordenador. D'un ponch de vista legal, la màger part de las fautas professionalas son prononciadas quand lo mètge s'es escartat de las practicas medicalas classicas[51].

Un autre ponch soslinhat per aqueles actors es l'importància de la justificacion del rasonament avent menat a un diagnostic medical. Existís de nombrosas tecnicas que permeton als modèls d'aprendissatge automatic medicals de justificar lors decisions. Una d'aquelas tecnicas consistís en la superposicion informatica d'una carta termica amb l'imatge medical analisat. Aiçò permet de confirmar que los algoritmes de vision per ordenador basan lor diagnostic sus l'analisi de partidas pertinentas de l'imatge. Las cartas termicas son generadas en utilizant divèrsas tecnicas d'aprendissatge automatic coma la visualizacion d'activacion de classa[52] o la cartografia de la saillance[53]. De metòdes de generacions permeton egalament de prene en consideracion lo contèxt medical en listant los principals factors, diagnostics, e analisis demograficas qu'an contribuït a aquela decision[50].

La question de la responsabilitat e la qualificacion dels algoritmes e dels dispositius de vision per ordenador coma produch o servici es centrala sul plan juridica. En efièch, lo tractament juridic vària sensiblament en foncion de l'estatut acordat[51]. Los algoritmes de vision per ordenador destinats a automatizar una tasca clinica son generalament categorizats[54] per la FDA coma de dispositius medicals. Son siá incorporats coma dispositius medicals tradicionals o siá classificats coma logicials de guida de dispositiu medical.

Reconeissença faciala[modificar | modificar lo còdi]

La reconeissença faciala es una de las utilizacions mai frequentas de la vision per ordenador. Permet de determinar se de caras apareissent sus d'imatges diferents correspondon a la meteissa persona. Se los imatges son estats preses dins las meteissas condicions (distància, esclairatge, expression,...), alara lo problèma se simplifica a la mesura de qualques caracteristicas de la cara. Dins de situacions realas, es generalament pas lo cas e los informaticians an degut utilizar la vision per ordenador per desvolopar de metòdes per tal d'identificar las caras presentas dins los documents audiovisuals[55].

Dins la cultura populara[modificar | modificar lo còdi]

L'interès de cap al domeni dels algoritmes de vision per ordenador a aumentat de faiçon importanta a partir de las annadas 2015. De nombroses actors cinematografics e mediatics participan a la vulgarizacion d'aquela tecnologia, entre autras Netflix amb lo documentari « Coded Biàs »[56] presentat al festenal de Sundance a Zuric e al Festenal del film e fòrum internacional suls dreches umans de Genèva (FIFDH) en 2020. « Coded Biais » es un documentari tractant de diferentas consequéncias indesirablas de l'utilizacion d'algoritmes de vision per ordenador. Lo telespectator es convidat a seguir Joy Buolamwin, una cercaira del MIT, que, après s'èsser mainada qu'un logicial de reconeissença faciala reconeissiá pas las caras de personas negras mas plan lo de personas blancas, investiga l'origina d'aquel problèma. L'enquèsta de la cercaira indica una reala omnipreséncia de bescaire dins los algoritmes de vision per ordenador, tocant majoritàriament las femnas aital coma las personas de colors. L'algoritme utilizat per Amazon per triar las candidaturas d'aplicacion per d'ofèrtas de trabalh, dels algoritmes ofrent de melhors accèsses als suènhs e a de melhors crèdits immobiliaris a de personas blancas qu'a de personas de colors son ponchats del det. Lo documentari s'interèssa egalament a l'utilizacion d'aqueles algoritmes dins de perspectivas comercialas e de susvelhança de massa. Per exemple, lo governament central chinés a utilizat d'algoritmes de vision per ordenador per identificar los manifestants independentistas a Hong-Kong en 2019. Lo film se basa sus de testimoniatges de diferentas personas victimas d'aqueles biaisses al quotidian. La realizatritz met endavant l'importància qu'aquelas tecnologias siá d'una part fòrça mai somesas a de juridiccions estrictas mas tanben la necessitat qu'aqueles algoritmes sián desvolopats per d'entrepresas a tòca non lucrativa, çò que permetriá sustot una mai larja acceptacion d'aquelas tecnologias per las populacions[57].

Nòtas e referéncias[modificar | modificar lo còdi]

  1. Dana H. Ballard, Computar vision, Prentice-Hall, (ISBN 0-13-165316-4 e 978-0-13-165316-0, OCLC 7978044, lira en linha)
  2. C. E. Vandoni, Proceedings : 1996 CERN School of Computing : Egmond aan Zee, the Netherlands, 8 September-21 September 1996, CERN, (ISBN 9789290830955, OCLC 988737270, lira en linha)
  3. Gòira Sonka e Roger Boyle, Imatge processing, analysis, and maquina vision, Thompson Learning, (ISBN 0-495-08252-X, 978-0-495-08252-1 e 978-0-495-24438-7, OCLC 123776599, lira en linha)
  4. Reinhard Klette, Concisa computar vision : an introduccion into theory and algorithms, (ISBN 978-1-4471-6320-6, 1-4471-6320-6 e 1-4471-6319-2, OCLC 869222487, lira en linha)
  5. Shapiro, Linda G., Computar vision, Prentice Hall, (ISBN 0-13-030796-3 e 978-0-13-030796-5, OCLC 247860912, lira en linha)
  6. Morris, Tim, 1960-, Computar vision and imatge processing, Palgrave Macmillan, (ISBN 0-333-99451-5 e 978-0-333-99451-1, OCLC 52486158, lira en linha)
  7. Jähne, Bernd, 1953- Haussecker, Horst., Computar vision and aplicacions : a guida for students and practitioners, Academic Press, (ISBN 978-0-12-379777-3 e 0-12-379777-2, OCLC 162574303, lira en linha)
  8. Forsyth, David A., Autor., Computar vision : a modern approach (ISBN 978-1-292-01408-1 e 1-292-01408-3, OCLC 1156470337, lira en linha)
  9. Richard Szeliski, « Computar Vision », Texts in Computar Sciéncia,‎ (ISSN 1868-0941 e 1868-095X, DOI 10.1007/978-1-84882-935-0, lira en linha, consultat lo )
  10. « Intelligent Vision », dins AI in the 1980s and Beyond, The MIT Press, (ISBN 978-0-262-25626-1, lira en linha).
  11. Takeo Kanade, Three-Dimensional Engenha Vision, Springer US, (ISBN 978-1-4613-1981-8 e 1-4613-1981-1, OCLC 852791356, lira en linha)
  12. a e b Nicu Sebe, Maquina learning in computar vision, Springer, (ISBN 978-1-4020-3275-2, 1-4020-3275-7 e 1-4020-3274-9, OCLC 262677676, lira en linha)
  13. William Freeman, Pietro Perona e Bernhard Schölkopf, « Guest Editorial », Internacional Journal of Computar Vision, panatòri. 77, nòs 1-3,‎ , p. 1–1 (ISSN 0920-5691 e 1573-1405, DOI 10.1007/s11263-008-0127-7, lira en linha, consultat lo )
  14. Richard Szeliski, Computar Vision: Algorithms and Aplicacions, Springer Sciéncia & Business Media. (ISBN 978-1-84882-935-0)
  15. Steger, Carsten; Markus Ulrich; Christian Wiedemann (2018). Maquina Vision Algorithms and Aplicacions(2nd ed.). Weinheim: Wiley-VCH. p. 1. (ISBN 978-3-527-41365-2). Retrieved 2018-01-30.
  16. 6. Murray, Dòn, and Cullen Jennings. "Stereo vision based mapping and navigacion for mobil robòts." Proceedings of Internacional Conference òm Robotics and Automacion. Panatòri. 2. IEEE, 1997.
  17. Wäldchen, Jana; Mäder, Patrick (2017-01-07). "Plant Species Identificacion Using Computar Vision Tecnicas: A Systematic Literature Review". Archius of Computational Methods in Engineering. 25 (2): 507–543. doi:10.1007/s11831-016-9206-z. ISSN 1134-3060. PMC 6003396. PMID 29962832
  18. . E. Roy Davies, Maquina Vision: Theory, Algorithms, Practicalities., Morgan Kaufmann, 2005 (ISBN 978-0-12-206093-9)
  19. Ando, Mitsuhito; Takei, Toshinobu; Mochiyama, Hiromi (2020-03-03). "Rubber artificial skin layer with flexibla estructura for shape estimacion of micro-undulation susfàcias". ROBOMECH Journal. 7 (1): 11. doi:10.1186/s40648-020-00159-0. ISSN 2197-4225.
  20. Choi, Seung-hyun; Tahara, Kenji (2020-03-12). "Dexterous object manipulacion by a multi-fingered robotic hand with visual-tactila fingertip sensors". ROBOMECH Journal. 7(1): 14. doi:10.1186/s40648-020-00162-5. ISSN 2197-4225
  21. Bruijning, Marjolein; Vissar, Marco D.; Hallmann, Caspar A.; Jongejans, Eelke; Golding, Nick (2018). "trackdem: Automated particle tracking to obtain populacion counts and size distribucions from videos in r". Methods in Ecology and Evolucion. 9 (4): 965–973. doi:10.1111/2041-210X.12975. ISSN 2041-210X
  22. a b e c Jay Aronson, « Preserving Human Rights Media for Justice, Accountability, and Historical Clarificacion », Genocide Studies and Prevention, panatòri. 11, no 1,‎ , p. 82–99 (ISSN 1911-0359 e 1911-9933, DOI 10.5038/1911-9933.11.1.1441, lira en linha, consultat lo )
  23. « Making Secondary Traumà a Primary Eissida: A Study of Eyewitness Media and Vicarious Traumà òm the Digital Frontline », sus eyewitnessmediahub.com (consultat lo )
  24. a e b Jay D. Aronson, « Computar Vision and Maquina Learning for Human Rights Video Analysis: Casa Studies, Possibilities, Concerns, and Limitacions », Law & Social Inquiry, panatòri. 43, no 04,‎ , p. 1188–1209 (ISSN 0897-6546 e 1747-4469, DOI 10.1111/lsi.12353, lira en linha, consultat lo )
  25. « quarterly-updateòm-conflict-and-diplomacy-16-february-15-may-2013;hr », sus Human Rights Documents online (consultat lo )
  26. Weizman, Eyal, author., Forensic Arquitectura : violéncia at the threshold of detectability (ISBN 1-935408-87-9 e 978-1-935408-87-1, OCLC 1090385835, lira en linha)
  27. Steven Shapin, « Pump and Circumstance: Robert Boyle's Literary Technology », Social Studies of Sciéncia, panatòri. 14, no 4,‎ , p. 481–520 (ISSN 0306-3127 e 1460-3659, DOI 10.1177/030631284014004001, lira en linha, consultat lo )
  28. Neal Feigenson e Christina Spiesel, Law òm Display, NYU Press, (ISBN 978-0-8147-2758-4, lira en linha)
  29. a e b Jack Stilgoe, « Maquina learning, social learning and the governance of self- driving cars », Social Studies of Sciéncia, panatòri. 48, no 1,‎ , p. 25–56 (ISSN 0306-3127 e 1460-3659, DOI 10.1177/0306312717741687, lira en linha, consultat lo )
  30. (en) « Blòg | Tesla », sus www.tesla.com (consultat lo )
  31. (en) « Blòg | Tesla », sus www.tesla.com (consultat lo )
  32. (en) Andrew J. Hawkins, « Self- driving perque makers don't sound extrà excited to share datèt with the federal government », sus The Verge, (consultat lo )
  33. Kate Crawford e Ryan Calo, « There is a blind espòt in AI research », Nature, panatòri. 538, no 7625,‎ , p. 311–313 (ISSN 0028-0836 e 1476-4687, DOI 10.1038/538311a, lira en linha, consultat lo )
  34. J.-F. Bonnefon, A. Shariff e I. Rahwan, « The social dilemma of autonomous vehicles », Sciéncia, panatòri. 352, no 6293,‎ , p. 1573–1576 (ISSN 0036-8075 e 1095-9203, DOI 10.1126/sciéncia.aaf2654, lira en linha, consultat lo )
  35. Mike Ananny e Kate Crawford, « Seeing without knowing: Limitacions of the transparency ideal and its aplicacion to algorithmic accountability », New Media & Society, panatòri. 20, no 3,‎ , p. 973–989 (ISSN 1461-4448 e 1461-7315, DOI 10.1177/1461444816676645, lira en linha, consultat lo )
  36. Mike Ananny, « Toward an Ethics of Algorithms », Sciéncia, Technology, & Human Valgudas, panatòri. 41, no 1,‎ , p. 93–117 (ISSN 0162-2439 e 1552-8251, DOI 10.1177/0162243915606523, lira en linha, consultat lo )
  37. Alan F. T. Winfield e Marina Jirotka, « The Casa for an Ethical Black Bòx », dins Towards Autonomous Robotic Systems, Springer Internacional Publishing, (ISBN 978-3-319-64106-5, lira en linha), p. 262–273
  38. (en-US) Fred Lambert, « The Big Tesla Hack: A hacker gained control over the entire fleet, beguèt fortunately he's a good guy », sus Electrek, (consultat lo )
  39. (en) « Team of hackers take remote control of Tesla Model S from 12 milas away », sus the Guardian, (consultat lo )
  40. (en) « Securing the futura of mobility », sus Deloitte Insights (consultat lo )
  41. Anna Pelagotti, Andrea Mastio, Alessia Rosa e Alessandro Piva, « Multispectral imaging of paintings », IEEE Senhal Processing Revista, panatòri. 25, no 4,‎ , p. 27–36 (ISSN 1053-5888, DOI 10.1109/msp.2008.923095, lira en linha, consultat lo )
  42. a b c e d David G. Stork, « Computar Vision and Computar Graphics Analysis of Paintings and Drawings: An Introduccion to the Literature », dins Computar Analysis of Imatges and Patterns, Springer Berlin Heidelberg, (ISBN 978-3-642-03766-5, lira en linha), p. 9–24
  43. K. Martinez, J. Cupitt, D. Saunders e R. Pillay, « Ten years of art imaging research », Proceedings of the IEEE, panatòri. 90, no 1,‎ , p. 28–41 (ISSN 0018-9219, DOI 10.1109/5.982403, lira en linha, consultat lo )
  44. Igor Berezhnoy, Eric Postma e Jaap van den Herik, « Computar analysis of Van Gogh’s complementary colours », Pattern Recognition Letters, panatòri. 28, no 6,‎ , p. 703–709 (ISSN 0167-8655, DOI 10.1016/j.patrec.2006.08.002, lira en linha, consultat lo )
  45. Proceedings of SPIE, « Front Matter: Volum 6810 », Computar Imatge Analysis in the Study of Art, SPIE,‎ (DOI 10.1117/12.792811, lira en linha, consultat lo )
  46. D.G. Stork, « Computar Vision, Imatge Analysis, and Mastèr Art: Part 1 », IEEE Multimedia, panatòri. 13, no 3,‎ , p. 16–20 (ISSN 1070-986X, DOI 10.1109/mmul.2006.50, lira en linha, consultat lo )
  47. (en) I.E. Berezhnoy, E.O. Postma e H.J. van den Herik, « Authentic: Computerized Brushstroke Analysis », 2005 IEEE Internacional Conference òm Multimedia and Expo, IEEE,‎ (ISBN 0-7803-9331-7, DOI 10.1109/icme.2005.1521739, lira en linha, consultat lo )
  48. Bronwen Brown, « Secrèt Knowledge: Rediscovering the Lost Tecnics of the Old Masters200294David Hockney. Secrèt Knowledge: Rediscovering the Lost Tecnics of the Old Masters. London: Thames and Hudson 2001. 296pp, (ISBN 0 500 23785 9) £35.00 », Reference Reviews, panatòri. 16, no 2,‎ , p. 35–36 (ISSN 0950-4125, DOI 10.1108/rr.2002.16.2.35.94, lira en linha, consultat lo )
  49. « The Next Rembrandt », sus The Next Rembrandt (consultat lo )
  50. a b e c (en) « Maquina Vision, Medical AI, and Malpractice », sus Harvard Journal of Law & Technology (consultat lo )
  51. a e b BEN A. RICH, « Medical Custom and Medical Ethics: Rethinking the Standard of Care », Cambridge Quarterly of Healthcare Ethics, panatòri. 14, no 01,‎ (ISSN 0963-1801 e 1469-2147, DOI 10.1017/s0963180105050048, lira en linha, consultat lo )
  52. Pranav Rajpurkar, Jeremy Irvin, Robyn L. Ball e Kaylie Zhu, « Deep learning for chest radiograph diagnosis: A retrospective comparison of the CheXNeXt algorithm to practicing radiologists », PLOS Medicine, panatòri. 15, no 11,‎ , e1002686 (ISSN 1549-1676, DOI 10.1371/jornal.pmed.1002686, lira en linha, consultat lo )
  53. Andre Esteva, Brett Kuprel, Roberto A. Novoa e Justin Ko, « Dermatologist-level classificacion of skin càncer with deep neural networks », Nature, panatòri. 542, no 7639,‎ , p. 115–118 (ISSN 0028-0836 e 1476-4687, DOI 10.1038/nature21056, lira en linha, consultat lo )
  54. (en) Center for Devices and Radiological Health, « Artificial Intelligéncia and Maquina Learning in Logicial as a Medical Device », FDA,‎ (lira en linha, consultat lo )
  55. (en) Adam Geitgey, « Engenha Learning is Fun! », sus Medium, (consultat lo )
  56. « lo documentari "Coded Biàs" revèla la discriminacion dels algoritmes », sus rts.ch, (consultat lo )
  57. Elina S, « Coded Biàs : un film Netflix sul racisme de l'intelligéncia artificiala », sus Lebigdata.fr, (consultat lo )

Veire tanben[modificar | modificar lo còdi]

Articles connèxes[modificar | modificar lo còdi]