Ziua de ieri a fost plină de anunțuri interesante, unul dintre ele iese cu siguranță în evidență și probabil va rămâne de referință în istoria tehnologiei: OpenAI a prezentat proiectul Sora, care permite generarea de materiale video pornind de la descrieri text.
Greg Brockman a făcut anunțul pe Twitter:
În acest moment modelul Sora e încă în faza de dezvoltare, însă ne arată ce potențial există în acest domeniu, în acest moment, fiind capabil să extragă elemente cheie din descrierile text și să construiască niște materiale video care arată uluitor. E drept, sunt folosite câteva tehnici de a păcăli mintea că ceea ce vedem este adevărat (observați că materialele generate de Sora arată atât subiectul în mișcare, cât și camera, o chestie care e folosită des în jocuri ca să simuleze adâncimea și mișcarea propriuzisă).
Sora poate genera materiale de maxim 1 minut (acum) iar dacă aveți chef să vedeți toate demo-urile publicate de OpenAI o să descoperiți cât de avansat este modelul, fiind capabil să înțeleagă instrucțiunile text și să le transpună în interacțiuni complexe, în model 3D.
OpenAi a mai publicat încă set de materiale generate cu Sora, primul dintre ele fiind cel mai jos, construit în urma acestui text: ˝Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.˝
Urmează apoi un trailer de film, ˝A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.˝
O simulare a unei filmări din dronă: ˝Drone view of waves crashing against the rugged cliffs along Big Sur’s garay point beach. The crashing blue waters create white-tipped waves, while the golden light of the setting sun illuminates the rocky shore. A small island with a lighthouse sits in the distance, and green shrubbery covers the cliff’s edge. The steep drop from the road down to the beach is a dramatic feat, with the cliff’s edges jutting out over the sea. This is a view that captures the raw beauty of the coast and the rugged landscape of the Pacific Coast Highway.˝
Sau o construcție extrem de reală a unei nave de pirați plutind într-o cană de cafea: ˝Photorealistic closeup video of two pirate ships battling each other as they sail inside a cup of coffee.˝
Materialele video sunt impresionante și din prisma calității nu doar pentru că înțelegerea principiilor fizicii pare să fie bine implementată. Zic că pare, pentru că am mai văzut demo-uri impresionate legate de AI (vezi cel făcut pe genunchi de Google cu Gemini) care de fapt erau niște falsuri.
Dacă e într-adevăr adevărat ce zice OpenAI, atunci se deschid posibilități interesante pentru generarea de simulări și demonstrații pentru elemente abstracte, care acum necesită extrem de mult timp și pasiune din partea creatorilor 3D pentru a putea fi transpuse în video. În același timp e posibil să deschidă noi orizonturi pentru acele persoane care au imaginație, dar nu au avut timp să învețe tehnicile de filmare pentru a-și pune ideile în practică.
Doar că fix la fel ca modelele AI ce generează imagini (DALL-E), Sora are și potențialul de a face mult rău, prin generarea de conținut fake. De asta OpenAI spune că lucrează intens în direcția creării unor soluții capabile să recunoască materialele video generate de AI, în speță cu Sora.
Și tot din cauza aceasta modelul nu poate fi încă descărcat și nici folosit de public. Ca să nu mai vorbim despre discuțiile legate de proprietatea intelectuală.
Rămâne ca punct de referință faptul că deja vorbim de chestii accesibile via AI, care pe termen lung vor avea un impact imens asupra noastră a tuturor – gândiți-vă doar că acum, când vedem fake-uri grosolane, mulți nu pot să facă diferența între ce e real și ce e fals.
Cum va fi când modele precum Sora vor putea genera în câteva minute/ore materiale video la care acum creatorii lucrează ani de zile (să zicem doar filmul Avatar)?