Google announced a 5-second AI video generator that's scary good

Google bejelentette a rémisztően jó 5 másodperces AI videógenerátort

A Google új mesterséges intelligencia alapú videógenerátora a legfejlettebb a maga nemében — és ez a meggyőzőbb deepfake videók elterjedéséhez vezethet.

A Google Research bemutatta a Lumiere-t, egy olyan AI videógenerátort, amely egyszerű szöveges utasítások alapján képes öt másodperces fotorealisztikus videókat létrehozni. A kutatási eredmény szerint ami valóban fejletté teszi, az egy „Space-Time U-Net architektúra”, amely „egyszerre generálja a videó teljes időtartamát, egyetlen modellen áthaladva”.

A korábbi AI modellek videókat úgy hoztak létre, hogy képkockánként generálták az egyes képeket.

A Lumiere elméletben megkönnyítheti a felhasználóknak a videók létrehozását és szerkesztését anélkül, hogy szükség lenne technikai szakértelemre. Olyan parancsok, mint a „panda ukulelét játszik otthon” vagy „Naplemente időugrás a tengerparton” részletes fotorealisztikus videókat generálnak. A képek stílusa alapján is tud videókat generálni, például egy gyerek vízfestékkel festett virágit.

A szerkesztési képességek ennél is figyelemreméltóbbak. A Lumiere képes animálni a kép bizonyos részeit, és „videó inpainting” segítségével kitöltheti a képromptok üres területeit. Sőt, specifikus részeket tud szerkeszteni a videókon követési szöveges utasításokkal, például megváltoztatni egy nő ruháját vagy kiegészítőket adni baglyok és csibék videóihoz.

„Elsődleges célunk … az, hogy lehetővé tegyük a kezdő felhasználóknak vizuális tartalom generálását,” zárja a tanulmány. „Ugyanakkor fennáll a rosszindulatú vagy káros tartalom előállításának veszélye a technológiánkkal, és úgy gondoljuk, hogy létfontosságú eszközöket fejleszteni és alkalmazni a torzítások és rosszindulatú felhasználások észlelésére, hogy biztosítsuk a biztonságos és tisztességes használatot.”

Amiről a tanulmány nem említést tesz, az a Google által korábban kifejlesztett és állítólag helyen alkalmazott eszközök.

A tavalyi Google I/O konferencián a vállalat nagy hangsúlyt fektetett a biztonság és felelősség intézkedéseire. A Google DeepMind augusztusban indította el az AI vízjelző eszköznek, a SynthID-nek a béta változatát, és novemberben a YouTube (amely a Google tulajdonában van) bejelentette egy szabályt, amely kötelezi a felhasználókat arra, hogy felfedjék, ha a videók AI által generáltak.

A Lumiere egyelőre csak kutatási projekt és nincs arra utalás, hogy mikor és hogyan használható majd fel fogyasztói eszközként. De egy olyan cégnél, amely állítja, hogy „a mesterséges intelligenciával való merészkedés felelősségteljesen kezdődik” — feltéve, hogy a kezdés magában foglalja a kutatást — ez meglepő kihagyás a Lumiere csapat részéről.

A Google még nem reagált a hozzászólás kérésre.