Root NationNoviceIT noviceKot v filmih: Googlova nova umetna inteligenca za obdelavo fotografij omogoča spreminjanje velikosti in izboljšanje le-teh

Kot v filmih: Googlova nova umetna inteligenca za obdelavo fotografij omogoča spreminjanje velikosti in izboljšanje le-teh

-

Verjetno ste že videli domišljijske filme ali TV-oddaje, v katerih glavni lik zahteva povečavo slike in izboljšanje rezultata – prikaz obraza, registrske tablice ali katere koli druge ključne podrobnosti. Najnovejši Googlovi sistemi umetne inteligence (AI), ki temeljijo na t.i difuzijski modeli, lahko izvedejo ta trik.

To je zapleten postopek, ki ga je težko obvladati, ker v bistvu dodaja podrobnosti sliki, ki je fotoaparat prvotno ni zajel, z uporabo super pametnih ugibanj na podlagi drugih, podobnih slik.

google

Pri Googlu to tehniko imenujejo naravna sinteza slike in v tem posebnem scenariju ultravisoka ločljivost slike. Začnete z majhno sliko s piksli in končate z nečim ostrim, jasnim in naravnim. Morda ni ravno izvirnik, vendar je dovolj blizu, da človeško oko izgleda resnično.

Google je predstavil dve novi orodji AI za to delo. Prvi se imenuje SR3 ali Super-Resolution via Repeated Refinement in deluje tako, da sliki doda šum in ga nato odstrani. S serijo verjetnostnih izračunov, ki temeljijo na veliki zbirki podatkov slik in nekaj čarovnije strojnega učenja, si lahko SR3 predstavlja, kako izgleda supervisokoločljiva različica slikovnih pik z nizko ločljivostjo.

Drugo orodje je CDM ali modeli kaskadne difuzije. Google jih opisuje kot "cevovode", po katerih je mogoče usmeriti difuzijske modele – vključno s SR3 – za visokokakovostno povečanje velikosti slike. Vzame izboljšave modelov in jih pretvori v večje slike.

google

Z uporabo različnih modelov izboljšave pri različnih ločljivostih lahko pristop CDM prekaša alternativne metode povečanja slike, glede na Google. Novi mehanizem umetne inteligence je bil preizkušen na ImageNet, velikanski bazi podatkov slik za usposabljanje, ki se običajno uporabljajo za raziskave vizualnega prepoznavanja predmetov.

Končni rezultati SR3 in CDM so impresivni. V standardnem testu s 50 prostovoljci so bile slike človeških obrazov, ki jih je ustvaril SR3, približno 50 % časa zamenjane za prave fotografije – in glede na to, da bi moral idealen algoritem doseči 50 %, je to impresivno. Vredno je ponoviti, da te izboljšane slike niso natančna ujemanja z izvirniki, ampak so skrbno izračunane simulacije, ki temeljijo na matematiki verjetnosti.

google

Google obljublja veliko več od svojih novih mehanizmov umetne inteligence in sorodnih tehnologij – ne samo v smislu povečanja slik obrazov in drugih naravnih objektov, ampak tudi na drugih področjih verjetnostnega modeliranja.

Preberite tudi:

Prijavite se
Obvesti o
gost

0 Komentarji
Vdelana mnenja
Prikaži vse komentarje