Dette AI-neurale netværk fra Nvidia skaber fotorealistiske falske billeder

$config[ads_kvadrat] not found

How Machines Learn

How Machines Learn
Anonim

På et overblik ser billedet op øverst ud som et almindeligt billede af en almindelig gade, taget enten fra et dash-kamera eller fra en dum nok til at vandre ind i vejen for at få et billede af en sådan dagligdags scene.

Men se lidt nærmere. Bemærk hvordan trafiksignalet er lidt skævt, eller hvordan nogle af bilerne virker uklar? Der er noget galt her. Dette er slet ikke et billede. Det er et billede, der blev skabt helt af en A.I.

Computerforskere fra teknologibedriften Nvidia og University of California, Berkeley, har skrevet et forskningspapir, der findes i preprint på arXiv, og beskriver hvordan de kunne få et neuralt netværk til at generere realistiske gadebilleder og menneskelige portrætter. De inkluderede endda en brugergrænseflade, der lader dig tilpasse billederne, men du vil gerne tilføje ekstra løv eller endda ændre vejret.

"Gaming vokser hurtigt, fordi folk elsker at interagere med hinanden i virtuelle miljøer" fortæller Ming-Yu Liu, seniorforsker hos Nvidia Inverse i en email. "Det er dog dyrt at opbygge virtuelle verdener med dagens teknologi, fordi det kræver, at kunstnere eksplicit modeller og simulerer tekstur og belysning til den verden, de bygger. Med billed-til-billed oversættelse kan vi i stedet prøve den virkelige verden for at skabe virtuelle verdener."

Neurale netværk er computere, der er modelleret til at fungere som en menneskelig hjerne ved at indhente information, anvende den og lære af resultaterne. Denne forskning benyttede specielle typer af neurale net introduceret af Ian Goodfellow i 2014, kaldet generative adversarielle netværk - eller GAN'er - som generelt består af to netværk, generatoren og diskriminatoren.

Generatoren får billeder og begynder at lave syntetiske billeder, der ligner dem, der blev givet. Det viser så en blanding af de billeder, den blev givet og falskene til diskriminatoren, hvis job det er at fortælle dem fra hinanden. Da denne proces fortsætter, bliver generatoren bedre til at efterligne de originale billeder, og diskriminatoren bliver bedre til at fortælle forfalskningerne fra hinanden. Resultaterne er nogle ret overbevisende - og helt falske billeder.

Denne forskning bygger på den traditionelle GAN-model ved at tilføje splittelse af generatoren og diskriminator netværk til et par sub-netværk, hvilket giver mulighed for output af billeder med højere opløsning. De neurale netværk kan også tage et semantisk kort - eller en tegning af hvordan billedet skal se ud - og udfylde teksturerne selvstændigt. Brugere kan endda gå ind i tegningen og ændre tingene, hvis de vil tilføje bygninger i stedet for træer i gadevisning eller gøre øjnene bredere i et portræt.

Papiret sammenligner sine resultater med lignende eksperimenter udført ved hjælp af denne metode, den mest bemærkelsesværdige er pix2pix. Nvidia og UC Berkeley-undersøgelsen er i stand til at generere billeder med detaljer som små og præcise som læsbare licensplader, mens pix2pix udsender billeder, der næsten ligner akvarel malerier.

Selvom dette værktøj kan bruges til at tjene nogle gratis reddit karma med et par outlandish billeder, ser forfatterne et stort potentiale i at udnytte denne tilgang til at generere realistisk grafik med blot en simpel plan.

Hundredvis af timer med omhyggeligt arbejde går ind i at generere virtuelle verdener til brug i Google Maps, film og videospil. Liu siger, at denne model kunne tjene som en måde at smertefrit få mest muligt ud af designet og derefter gå ind og tilpasse detaljerne senere.

"I stedet for at gøre verden ved eksplicit modellering af den, kan vi opbygge verden implicit ved at bruge billed-til-billed oversættelse til at oversætte mellem en simpel model af verden, der ikke indeholder nogen tekstur eller belysning og en fotorealistisk produktion. Denne evne skal gøre det meget billigere at opbygge virtuelle verdener, "fortæller han Inverse.

For det næste trin i denne forskning håber teamet at undersøge video-til-video-oversættelse, som ville bruge neurale net til at skabe realistiske videoer. Et mål, som Lui siger, har udfordret forskere på området.

Nu ved du, hvor let falske billeder kan oprettes. Tro ikke på alt, hvad du ser på Google-billeder.

$config[ads_kvadrat] not found