Pelko pois: tekoäly ei korvaa oikeita valokuvaajia

Ole huoletta, tekoäly ei todellakaan tee valokuvaajista tarpeettomia lähiaikoina. Vaikka tekoälyn avulla voi tehdä myös vaikuttavia kuvia, on vielä alueita, joilla se epäonnistuu surkeasti.

Joku saattaa luulla tekoälyn voivan tuottaa mistä tahansa aiheesta niin realistisia kuvia, että ne vastaisivat täysin todellisia valokuvia. Se ei kuitenkaan ole totta läheskään aina.

Tekoälyllä ei todellakaan voi korvata ihmistä ja kameraa kaikessa. Joillain alueilla se toimii kyllä vakuuttavasti, mutta joillain toisilla taas se menee täyttä päätä metsään.

DigiKUVAn toimitus perustaakin yhä hyvästä syystä työnsä nimenomaan todellisiin valokuviin.

Seuraamme silti toki mielenkiinnolla teknologian kehitystä ja kirjoitamme usein artikkeleita tekoälyn uusimmista mahdollisuuksista. Siinä yhteydessä olemme törmänneet myös yllättäviin rajoituksiin ja huomanneet, kuinka älytön tekoäly voikin joskus olla. Esittelemme tässä kolme tekoälylle vaikeaa asiaa.

Tekoäly ei ymmärrä elementtien välisiä yhteyksiä

Kun olemme kirjoittaneet tekoälykuvia tuottavista ohjelmista, olemme usein pyytäneet niiltä esimerkkikuvia valokuvaajista. On tekoälyn tuotoksissa sitten ollut lintuja tiiraileva luontokuvaaja tai muotikuvauksia studiossa, kuvissa on toistuvasti ollut se perustavanlaatuinen ongelma, ettei tekoälyn tuottaman kuvaajan kamera edes osoita kuvattavaan kohteeseen vaan ties mihin satunnaiseen suuntaan.

Syynä on se, että tekoälymallit eivät yleensä pysty käsittelemään asioiden välisiä yhteyksiä. Niillä on tietoa siitä, mikä on lintu, ja ne pystyvät tuottamaan sellaisesta vakuuttavan kuvan, ja sama pätee valokuvaajaan. Ne eivät kuitenkaan ymmärrä valokuvaajan ja linnun välistä yhteyttä eivätkä siksi kykene yhdistämään näitä kahta elementtiä samaan kuvaan mielekkääksi kokonaisuudeksi.

Mitähän Google Geminin tuottaman kuvan kolmikätisellä valokuvaajalla oikein on mielessään, kun hänen kameransa osoittaa ihan muualle kuin näyttävästi poseeraavaan malliin.

Tekoäly ei selviä epäsymmetrisestä kuvien yhdistelemisestä

Tekoälyä käsitteleviä verkkoartikkeleita kirjoittaessamme olemme toisinaan pyytäneet tekoälyltä kuvakoosteita. Jos artikkelissa on käsitelty esimerkiksi viittä tekoälyohjelmaa, olemme pyytäneet viiden tekoälykuvan kollaasia, ja yllättäen se on ollut liikaa vaadittu. Riippumatta käytetystä tekoälystä olemme saaneet toistuvasti kollaaseja, joissa on kuusi kuvaa, vaikka tekoälylle olisi jo huomautettukin virheestä.

Syynä on se, että tekoäly ei osaa hahmottaa mittasuhteita, joita tarvitaan viiden kuvan yhdistämiseen nelikulmaiseksi kuvakoosteeksi.

ChatGPT:n tekemässä kuvakoosteessa on pyydetyn viiden sijaan kuusi kuvaa, ja niistä ensimmäisessä on myös aika kummallinen leikkaus.

Tekoäly kompastuu usein yksityiskohdissa

Kun haluaa tarkistaa, onko kuva tehty tekoälyllä, kannattaa katsoa, ovatko yksityiskohdat realistisia. Esimerkiksi kuvan eri elementtien eri suuntiin heittyvät varjot voivat paljastaa kuvan tekoälyn tekemäksi. Toinen hyvä tarkastelukohde ovat heijastukset, sillä lasissa tai vedessä näkyvät heijastukset eivät tekoälykuvissa aina vastaa täysin kuvan varsinaisia elementtejä.

Syynä on se, ettei tekoäly ymmärrä esimerkiksi valon ja varjon fysikaalisia peruslakeja, eikä se aina osaa käsitellä kuvassa näkyvän elementin peilikuvaa erilaisella pinnalla.

Kävelykadun hieno kiveys on tuottanut tekoälylle vaikeuksia, eivätkä Fireflyllä Photoshopissa tuotetun kuvan varjotkaan ole aivan johdonmukaisia.

Uusimmat tekoälyt ovat päässeet eroon karkeimmista virheistä

Mainitut kolme esimerkkiä eivät ole ainoita virheitä, joita tekoäly voi tehdä. Varsinkin kädet ja sormet ovat toistuvasti olleet tekoälymallit paljastavia kompastuskiviä. Myös symmetria voi olla ongelmallista, sillä esimerkiksi korvakorut ja sukat voivat tekoälykuvissa olla eri puolilla erilaisia, vaikka nimenomaisesti pyytäisi päinvastaista. Kuviin sisältyvät teksti voivat aiheuttaa vaikeuksia, samoin kuin ihmisten tai eläinten asennot ja anatomiset yksityiskohdat. Uusimmat tekoälymallit ovat kuitenkin näissä jo hieman aiempia parempia.