MediaGenie
Bedrijven in de media & entertainment-, publishing- en eventsector de kans bieden om zo snel mogelijk te profiteren van AI.
Als onderdeel van het onderzoeksproject MediaGenie hebben we in het najaar van 2024 een veelbelovend pilootproject afgerond. Met Auto-Foley tonen we aan hoe kunstmatige intelligentie, en specifiek Large Language Models (LLM's), breder inzetbaar zijn dan alleen voor tekstgeneratie.
Auto-Foley is een AI-gedreven workflow die automatisch geluidseffecten en ambience genereert op basis van videobeelden. Via beeldanalyse, text-to-audio en een editor kunnen makers snel sfeervolle audio toevoegen aan video's zonder diepgaande foley-expertise. De piloot toont dat AI vandaag al sterke inspiratie en tijdswinst biedt, vooral bij sfeeropbouw en repetitieve taken.
Mediabedrijven ervaren duidelijke uitdagingen rond audioproductie:
Foley blijft een craft, maar is vandaag vaak te duur of te traag.
Auto-Foley:
De workflow ondersteunt zowel niet-experts als professionele makers.
We onderzochten de haalbaarheid via:
AI bleek sterk in:
De kracht van Auto-Foley ligt in het begrijpen van de context en sfeer van een scène. Het systeem kan bovendien redeneren over off-screen geluiden: wat hoor je in deze situatie, zelfs als het niet in beeld is?
Human-in-the-loop blijft essentieel voor timing en sound design. AI vervangt de maker niet, maar versterkt en versnelt diens werk.
Zeer geschikt voor:
Minder geschikt voor: