Kategorije: IT novice

Ustvaril AI, ki pretvori 2D sliko v 3D model v 5 sekundah

Raziskovalci iz Adobeja in Avstralske nacionalne univerze so razvili algoritem, ki pretvori dvodimenzionalne slike v tridimenzionalne modele v samo 5 sekundah. Ta preboj obljublja revolucijo pri ustvarjanju vsebine v oblikovanju in zabavi, vendar pazite na morebitne težave z zamegljenimi teksturami in kršitvijo avtorskih pravic.

Novi algoritem, imenovan Large Reconstruction Model (LRM), je postal pomemben napredek pri hitrem ustvarjanju tridimenzionalnih modelov na podlagi ene same slike. Algoritem, usposobljen na velikem naboru podatkov s približno milijonom 3D-objektov, ki so na voljo v podatkovnih zbirkah Objaverse in MVImgNet, je pokazal izjemno sposobnost posploševanja pri delu z različnimi slikami za ustvarjanje XNUMXD-vsebine.

Za razliko od prejšnjih modelov, ki so bili usposobljeni na omejenih naborih podatkov s poudarkom na eni kategoriji slik, LRM uporablja transformativno arhitekturo, ki je postala osnova za številne razvojne dosežke globokega učenja s 500 milijoni parametrov. To omogoča modelu AI, da učinkovito deluje z različnimi tipi slik, vključno s fotografijami iz resničnega sveta in vizualnimi kolaži, ki jih ustvarijo druge storitve AI, kot sta DALL-E in Stable Diffusion.

Yitzong Hong, glavni avtor študije, je poudaril, da je LRM pomemben preboj na področju XNUMXD rekonstrukcije. Algoritem lahko reproducira podrobno geometrijo in zapletene teksture, na primer teksturo lesa, hkrati pa ohranja kakovost in natančnost.

Uporaba LRM lahko postane resnično množična, od oblikovanja in zabave do igralniške industrije. Za oblikovalce in 3D umetnike to pomeni pospešitev procesa ustvarjanja modelov, kar je še posebej pomembno pri razvoju videoiger in animacij. Poleg tega možnost uporabe LRM s strani navadnih uporabnikov obljublja, da bo 3D modeliranje postalo prednostna naloga ne le profesionalcev. Zdaj bo mogoče izdelati podrobne modele tudi iz fotografij, posnetih na pametnem telefonu.

Vendar ima LRM svoje omejitve, kot je zamegljenost tekstur v skritih delih slike. Prav tako je vredno razmisliti o vprašanjih avtorskih pravic, zlasti v kontekstu uporabe slik, ustvarjenih z drugimi storitvami umetne inteligence. Za predstavitev zmogljivosti LRM so Adobejevi raziskovalci ustvarili strani z video predstavitvami in interaktivnimi 3D modeli. To poudarja vse večjo vlogo umetne inteligence v današnjem svetu in njen potencialni vpliv na prihodnost kreativnih industrij.

Preberite tudi:

Delite s prijatelji, znanci, družino in partnerji :-)
Julia Alexandrova

Kofetar. Fotograf. Pišem o znanosti in vesolju. Mislim, da je še prezgodaj, da bi srečali nezemljane. Spremljam razvoj robotike, za vsak slučaj ...

Pustite Odgovori

Vaš e-naslov ne bo objavljen. Obvezna polja so označena*