Nu tar vi bildmanipulering till en ny nivå

Publicerad: 22 maj 2018

I en värld av Photoshop, filter och sociala medier har manipulerade bilder blivit vardagsmat. Men i takt med teknikens utveckling har det banat väg för fler, såväl skrämmande som spännande, möjligheter av manipulation. Låt oss ta det ett steg längre och addera realtid till konceptet.

Källa: BuzzFeedVideo, YouTube.com

Nu har artificiell intelligens och utvecklande datorgrafik gett upphov till en rad verktyg som möjliggör skapandet av video- och ljudmanipulation. Det är nu möjligt att skapa realistiska utseenden av offentliga personer som tycks säga precis vad som helst. Detta kan exempelvis ta sig uttryck likt ovanstående klipp. Att Obama pratar om hur denna funktion kan utnyttjas i fel syfte trots att det egentligen inte är han som pratar.

Källa: Matthias Niessner, YouTube.com

Med hjälp av en programvara som en forskningsgrupp vid Stanford University har utvecklat är det nu möjligt att manipulera videoklipp av personer för att sedan låta en annan person lägga orden i personens mun i realtid. Funktionen identifierar den andra personens ansiktsuttryck när hen pratar in i en webbkamera och överför rörelserna direkt på personen i den ursprungliga videon.

Att måla upp det som “framtidens fake news” är till viss del rättvist. Men låt oss istället kasta ljus på möjligheterna:

  • Efterproduktionen inom filmindustrin kommer gå betydligt smidigare tack vare tekniken. Idag kan man överföra en persons uttryck till en virtuell avatar. Men med den nya tekniken går det dessutom att överföra ansiktsuttryck och munrörelser till en annan mänsklig skådespelare utan att behöva någon avancerad hårdvaru- och långskanningsprocess. På så sätt kan man enkelt manipulera en skådespelares ansikte i efterhand i form av belysning, hudton och uttryck.

  • Dessutom kan det vara fördelaktigt inom spelindustrin. Där en spelares rörelse överförs till en virtuell avatar av samma person i ett onlinespel, vilket ger ett mer realistiskt uttryck.

  • Inom videokonferenser kan talarens ansikte matchas hos översättaren.

  • Videos kan även på ett mer naturligt och övertygande sätt dubbas på ett annat språk.

Samtidigt kan vi inte bortse från det faktum att alternativ fakta når en ny nivå. En nivå som försätter oss i en ny källkritisk situation där belysning, skuggor och ljudets synkronisering kommer spela en allt större roll.

Här kan du fördjupa dig i ämnet:

Face2Face: Real-time Face Capture and Reenactment of RGB Videos

Real-time Expression Transfer for Facial Reenactment