Appleova AI vraća 3D objekte iz jedne slike bez gubitka svjetla

Appleova AI vraća 3D objekte iz jedne slike bez gubitka svjetla📷 © Tech&Space
- ★LiTo model rekonstruira 3D bez geometrijskih grješaka
- ★Realistična svjetla i refleksije u svim kutovima
- ★Još nema verzija za konačne proizvode
Istraživači iz Applea razvili su model LiTo koji zaobilazi klasičnu trodimenzionalnu rekonstrukciju i direktno iz 2D slike generira 3D objekt s realističnim refleksijama i svjetlom. Rješenje se oslanja na latentni prostor koji omogućava učinkovito izračunavanje vizualnih svojstava bez obzira na kut gledanja.
Ovo nije prvi pokušaj ovakvog pristupa – ranija rješenja uglavnom su se usredotočila na geometriju ili difuzna svojstva površine, što često rezultira neželjenim artefaktima pri promjeni perspektive. LiTo, međutim, zadržava kontekst svjetla i sjaja, što je ključno za upotrebu u AR i renderingu.
Razvoj je objavljen kao dio studije usmjerene na površinsko svjetlosno polje i njegova svojstva. Tehnički gledano, model koristi transformersku arhitekturu za obradu podataka unutar latentnog prostora, što omogućava bržu obradu i manju ovisnost o hardverskim resursima.
Apple tako nastavlja s istraživanjem koje povezuje latentne modele i 3D vizualizaciju, slično kao i u drugim svojim projektima poput naprednih AR rješenja.

Od demonstracije do stvarnog učinka: gdje je jaz?📷 © Tech&Space
Od demonstracije do stvarnog učinka: gdje je jaz?
Iako Apple nije naveo planiranu integraciju u postojeće proizvode, community reagira s očekivanjem mogućih nadogradnji za Vision Pro ili iOS AR funkcije. Moguće je da će model biti dostupan kao dio budućih API-ja za razvojare, s naglaskom na realistične vizualne efekte.
Konkurent Appleu poput NVIDIA već nude rješenja za 3D rekonstrukciju iz 2D slika, ali njihovi pristupi često zahtijevaju dodatne ulazne podatke ili kompromise u kvaliteti svjetla. LiTo, s druge strane, smanjuje potrebu za složenim setovima za snimanje, što bi moglo biti značajno za mobilne uređaje i AR aplikacije.
Međutim, dok demo izgleda impresivno, još uvijek nisu poznati stvarni benchmark podaci koji bi potvrdili performanse u realnim scenarijima. Appleov Neural Engine mogao bi ubrzati obradu, ali bez javne dostupnosti alata teško je procijeniti stvarnu vrijednost ovog modela.
Kao što je već poznato, tehnologija 3D rekonstrukcije ima širok spektar primjena, od AR igara do simulacija i obuke. LiTo bi mogao biti ključni faktor u širenju ovih tehnologija među širem krugom korisnika. Svojim inovativnim pristupom, Apple otvara nove mogućnosti za kreativce i razvijatelje.