Tehnologia Google Brain de mărire a detaliilor din poze promite să aducă în realitate poveștile din filmele polițiste (vă aduceți aminte de scena din Twin Peaks în care se scot detalii impresionante dintr-o imagine extrem de mică?) care ne permit să mărim practic la infinit detaliile din diverse imagini.
În cazul de față, Google Brain poate (teoretic) să reconstruiască fața unei persoane pornind de la o imagine care nu conține practic niciun fel de detaliu care să poată fi recunoscut de ochiul uman. Dintr-o poză pixelată, de 8×8 (din coloana din stânga) Google Brain poate să ghicească detalii și să refacă imaginea destul de aproape de original.
Cum face asta? Prin combinarea a două rețele neurale. Prima este cea de condiții în care se încearcă suprapunerea sursei peste poze de rezoluție mare, prin reducerea acestora la o matrice de 8×8.
Apoi, folosind rețeaua prior, se folosește o implementare a PixelCNN pentru adăugarea de detalii peste matricea de 8×8. Mai pe înțelesul nostru, rețeaua prior nu face altceva decât să încerce să ghicească ce ar trebui să fie în respectiva imagine, folosind pentru asta colecția de poze cu celebrități și dormitoare la care are deja acces. Să zicem că dacă își dă seama că un pixel maro din partea superioară ar trebui să identifice un ochi/sprâncenele, va încerca să recreeze aceste detalii, tot luând informații de la fețele din pozele la care are acces. La final, rezultatele celor două analize sunt suprapuse și se obține imaginea reală.
Se pare că în testele făcute până acum cu Google Brain s-au obținut rezultate rezonabile, mult peste cele generate de clasica mărire bicubic scaling folosită de mai toate soluțiile de editare de imagini.
Cu toate astea, tehnologia nu poate încă (și nici nu cred că va putea vreodată) să obțină detalii clare din imagini super proaste. Google Brain vine cu o metodă de ghicire, care uneori s-ar putea să meargă, dar fiind vorba despre rețele neurale, rezultatele vor fi condiționate de calitatea informației deținute în baza de date de ”învățare”. Asta înseamnă că tot ceea ce ar putea fi recunoscut este de fapt ceva ce cunoaștem deja, nimic nou.
În cazul recunoașterii fețelor, dacă o poză proastă aparține unei fețe necunoscute, Brain nu prea are cum să ajungă la un rezultat corect.
Google Brain și DeepMind sunt proiecte Alphabet din zona deep learning și dacă vă pasionează subiectul atunci citiți mai multe aici. Viitorul sună interesant, nu?
Și poate la un moment dat ideile cu ”stop”, ”mărește” prezentate în filme să fie și reale, cam așa: