Er zijn een aantal AI-tools beschikbaar waarmee je tekst naar video kunt omzetten. De technologie is indrukwekkend, maar het eindresultaat is altijd met iets wat niet klopt. Het duurde een tijdje voordat de oorzaak van het probleem werd gevonden, maar uiteindelijk kwam het allemaal neer op één ding: het 'uncanny valley'-effect.
Hoewel je een aantal AI-hulpmiddelen kunt gebruiken om visuele effecten te creëren in je videoprojecten, is het niet aan te raden om alleen AI te gebruiken om videobeelden te maken, omdat het er te vreemd uitziet.
Het grootste probleem met AI-tekst-naar-video-tools
De generatie van AI-video heeft in korte tijd een grote ontwikkeling doorgemaakt dankzij de vooruitgang op het gebied van Deep Learning. In 2023, wanneer de generatie AI-video's explodeert, herinnert u zich misschien nog wel deze clip van Will Smith die spaghetti eet die viraal ging. Hoewel dit soort technologie destijds baanbrekend was, was het onmiskenbaar hoe onnatuurlijk en oncomfortabel het eruit zag.
In 2024 worden deze AI-videovormgevingstools steeds beter, waardoor ze vloeiendere beelden en realistischere bewegingen opleveren. Kijk eens naar het verschil tussen de video's die in 2023 met Runway Gen-2 zijn gemaakt en de video's die OpenAI in 2024 uitbracht om Sora AI te demonstreren. Sora is nog niet beschikbaar voor publiek gebruik, maar de kwaliteit ziet er veelbelovend uit:
De resultaten zijn weliswaar verbeterd, maar nog niet doorslaggevend. Ten eerste is Sora nog niet klaar voor gebruik, dus zitten we nog steeds vast aan minder geavanceerde generatoren die griezelige resultaten kunnen produceren, zoals de spaghettivideo van Will Smith.
Bekijk de video die met PixVerse is gemaakt met de opdracht: "Een persoon loopt op een zonnige dag door een park, lacht en zwaait naar de camera. Vogels vliegen over en bomen wiegen zachtjes in de wind . " (Vrij vertaald: "Een persoon loopt op een zonnige dag door een park, lacht en zwaait naar de camera. Vogels vliegen over en bomen wiegen zachtjes in de wind").
De eerste twee seconden ziet het er goed uit, maar daarna verdwijnen de vingers, het haar en het gezicht van de persoon in het niets! Ook al komen er steeds geavanceerdere hulpmiddelen zoals Sora die ons nauwkeurigere en mooiere video's opleveren, er is nog steeds iets verontrustends aan de door AI gegenereerde mensen en landschappen.
Oudere modellen produceerden vaak video's waarin de AI duidelijk te zien was, zoals klei-animatiebeelden, maar de verbeteringen van nieuwere tools zien er bijna te perfect uit.
Onnatuurlijk, ongemakkelijk en levenloos. Dit is precies het uncanny valley-effect: menselijk, maar toch niet helemaal.
Hoe goed deze hulpmiddelen ook zijn, het 'uncanny valley'-effect blijft bestaan. Tenzij u op zoek bent naar een abstracte, surrealistische stijl die u alleen in dromen tegenkomt, moet u voor uw videoprojecten niet vertrouwen op AI-tekst-naar-videohulpmiddelen.