Qualche tempo fa ho visto qualcuno lavorare sulla generazione di immagini IA in tempo reale nella realtà virtuale e ho dovuto segnalarglielo perché, sinceramente, non riesco a esprimere quanto sia maestoso osservare la realtà aumentata modulata dall'IA trasformare il mondo davanti a noi in magnifici paesaggi onirici emergenti.
L'applicazione dell'intelligenza artificiale alla realtà aumentata o virtuale non è un concetto nuovo, ma ha presentato alcune limitazioni applicative, tra cui la potenza di calcolo, uno dei principali ostacoli al suo utilizzo pratico. Il software di generazione di immagini Stable Diffusion, tuttavia, è un algoritmo concepito per l'uso su hardware di fascia consumer ed è stato rilasciato con licenza Creative ML OpenRAIL-M. Ciò significa che non solo gli sviluppatori possono utilizzare la tecnologia per creare e lanciare programmi senza dover noleggiare grandi quantità di silicio per server, ma possono anche monetizzare le proprie creazioni.
Mi sono svegliato nel cuore della notte per concettualizzare questo progetto
ScottieFox TTV (si apre in una nuova scheda) è un creatore che ha mostrato il suo lavoro con l'algoritmo VR su Twitter. "Mi sono svegliato nel cuore della notte per concettualizzare questo progetto", dice. Come creatore, capisco che le Muse amano colpire a orari insoliti.
Ciò che hanno apportato è stata una fusione di Stable Diffusion VR e TouchDesigner (si apre in una nuova scheda) motore di sviluppo di applicazioni, i cui risultati lui chiama "spazio latente immersivo in tempo reale". Questo potrebbe sembrare un nonsenso hippie ad alcuni, ma lo spazio latente è un concetto che affascina il mondo in questo momento.
A livello basilare, è un'espressione che, in questo contesto, descrive il potenziale di espansione che l'IA porta con sé nella realtà aumentata, poiché trae spunti dalla vastità dell'ignoto. Sebbene sia un concetto interessante, è un'opzione per una funzionalità futura. Al momento sono interessato a come la VR a diffusione stabile riesca a funzionare così bene in tempo reale senza coinvolgere alcuna GPU consumer (nemmeno la recente RTX 4090). (si apre in una nuova scheda)) in una pozzanghera fumante.
Diffusione Stabile VR: spazio latente immersivo in tempo reale. 🔥Piccole clip vengono inviate dal motore per la diffusione. Una volta pronte, vengono rimesse in coda nella proiezione. Strumenti utilizzati: https://t.co/UrbdGfvdRd https://t.co/DnWVFZdppT#aiart #vr #stablediffusionart #touchdesigner #deforum pic.twitter.com/x3QwQDkapT11 ottobre 2022
"Trasmettere piccole porzioni nell'ambiente consente di risparmiare risorse", spiega Scotty. "Piccole clip vengono inviate dal motore per la trasmissione. Una volta pronte, vengono rimesse in coda nella proiezione". I riquadri blu nelle immagini mostrano le parti dell'immagine su cui l'algoritmo sta lavorando in un dato momento. È un modo molto più efficiente per farlo funzionare in tempo reale.
Chiunque abbia utilizzato uno strumento di generazione di immagini online capirà che la creazione di una singola immagine può richiedere fino a un minuto, ma anche se ci vuole un po' di tempo per elaborare ogni singola sezione, i risultati sembrano comunque immediati, perché non ci si concentra sull'attesa che una singola immagine finisca di sfocarsi. E sebbene non raggiungano il livello di fotorealismo che potrebbero raggiungere in futuro, i video che Scotty pubblica sono assolutamente mozzafiato.
Pesci volanti in soggiorno, idee di interior design in continua evoluzione, foreste lussureggianti e paesaggi notturni che si evolvono davanti ai nostri occhi. Con un'intelligenza artificiale in grado di proiettare dati sul nostro mondo fisico in tempo reale, il potenziale di utilizzo nel mondo del gaming è enorme.
Il CEO di Midjourney, David Holz, descrive il potenziale dei giochi di diventare un giorno dei “sogni” (si apre in una nuova scheda) e sembra proprio che ci stiamo muovendo a testa bassa in quella direzione. Tuttavia, il prossimo passo importante è destreggiarsi nel campo minato delle questioni relative al copyright e alla protezione dei dati. (si apre in una nuova scheda) che emergono attorno ai set di dati su cui sono stati addestrati algoritmi come Stable Diffusion.