Rețeaua Neuronală A învățat Să Genereze Videoclipuri Pe Baza Descrierii - Vedere Alternativă

Rețeaua Neuronală A învățat Să Genereze Videoclipuri Pe Baza Descrierii - Vedere Alternativă
Rețeaua Neuronală A învățat Să Genereze Videoclipuri Pe Baza Descrierii - Vedere Alternativă

Video: Rețeaua Neuronală A învățat Să Genereze Videoclipuri Pe Baza Descrierii - Vedere Alternativă

Video: Rețeaua Neuronală A învățat Să Genereze Videoclipuri Pe Baza Descrierii - Vedere Alternativă
Video: Cum să descarc video de pe Youtube 2024, Mai
Anonim

Inteligența artificială creează videoclipuri scriptate - până acum scurte și neclare, dar într-o singură zi va înlocui un întreg studio de film.

Rețelele neuronale sunt deja destul de bune (și în multe cazuri mai bune decât oamenii) la recunoașterea tiparelor dintr-o imagine și sunt capabile să descrie în termeni generale scene întregi. Rețelele neuronale generative efectuează transformarea inversă și pot forma o imagine pe baza descrierii sale sau pot prezice următorul cadru pe baza celor anterioare.

Dezvoltatorii belgieni au mers și mai departe, combinând aceste capacități într-un singur sistem care creează videoclipuri „din nimic”, bazate pe experiența proprie de învățare automată și text de script. Tinne Tuytelaars a vorbit despre acest lucru în cadrul unei reuniuni a Asociației pentru Îmbunătățirea Inteligenței Artificiale (AAAI) organizată în Statele Unite.

Rețeaua neuronală funcționează în două etape - conform lui Tinne, ca și cum ar imita procesul creativ al unei persoane: la prima etapă, se formează o „schiță” încețoșată, aproximativă a fiecărui cadru, după care se specifică și se adaugă detalii. Una dintre părțile importante ale unui astfel de sistem este rețeaua neuronală discriminatorie, care compară rezultatul cu videoclipuri „reale” potrivite pentru un scenariu dat și vă permite să evaluați calitatea acestuia, îmbunătățind activitatea părții generative a sistemului.

Rețeaua neuronală a fost antrenată pe 10 scene („joc de golf pe iarbă”, „kitesurfing în mare” etc.) și a învățat să separe acțiunile și circumstanțele unele de altele, și le putea combina, de asemenea, în orice mod dat, creând videoclipuri, de exemplu. "Golf în piscină":

Image
Image

sau „navigând pe zăpadă”:

Image
Image

Video promotional:

Desigur, calitatea acestor animații este încă departe de a fi acceptabilă: „videoclipurile” care durează aproximativ o secundă constau din doar 32 de cadre cu dimensiuni de 64x64 pixeli.

Dar, cu aceeași încredere, este posibil să se garanteze că aceste numere se vor îmbunătăți rapid, pentru că nu cu mult timp în urmă, cinematografia în sine nu se putea lăuda decât cu o imagine noroasă, zgâlțâitoare și mută. Dacă o astfel de rețea neurală poate fi realizată într-adevăr rapid și eficient, Hollywood-ul poate ajunge la capăt: va fi suficient pentru a lua scenariul și filmul este gata. Această oportunitate va fi utilă în generarea unor seturi mari pentru antrenarea altor rețele neuronale și în crearea de noi algoritmi pentru comprimarea și transmiterea fluxurilor video.

Serghei Vasiliev

Recomandat: