A Google új Lumiere nevű MI-videógenerátora a szélben rebbegő lepkétől a sétáló űrhajósig terjedő rendkívüli jelenetekkel hívja fel magára a figyelmet. Ezek az öt másodperces, 1024×1024 pixeles videók, bár még csak bemutató állapotban vannak, már most megmutatják a technológia lenyűgöző képességeit. A Google által alkalmazott tér-idő-diffúziós modell lehetővé teszi ezeknek a különleges videóknak a valós időben, zökkenőmentesen történő létrehozását. A Lumiere AI által létrehozott jelenetek, amelyek a természeti csodáktól az űrkalandokig terjednek, bemutatják a rendszer kreatív és sokoldalú alkotói potenciálját.

A Lumiere nemcsak szórakoztató, hanem technológiai szempontból is jelentős. A Google állítása szerint az új architektúra lehetővé teszi a videó teljes időtartamának egyszerre, egyetlen átmenettel való generálását. Ez az újítás jelentős előrelépést jelent a globális időbeli konzisztencia elérésében, szemben a hagyományos videómodellekkel, amelyek távoli kulcskockákat szintetizálnak, és időbeli szuperfelbontást alkalmaznak. A Lumiere a tér és az idő egyidejű kezelésével képes simább, folyamatosabb videókat létrehozni.

A Google új Lumiere nevű MI-videógenerátora a szélben rebbegő lepkétől a sétáló űrhajósig terjedő rendkívüli jelenetekkel hívja fel magára a figyelmet.

A Google által kínált demók széles skáláján találhatók állóképek videókká való konvertálása, referenciakép alapú stílusgenerálás és szöveges felszólítások segítségével történő következetes videószerkesztés. Ezek a képességek azt mutatják, hogy a Lumiere nem csupán a jelenlegi technológiákat haladja meg, hanem az emberi kreativitás új formáit is inspirálhatja. Egy ilyen eszköz segíthet a súlyos betegek kommunikációjában, mint például a Lenovo és a DeepBrain AI videógenerátorai.

A Lumiere kiképzéséhez 30 millió videót használtak, amelyek 80 képkocka hosszúságúak, és 16 fps sebességgel futnak. A Google hangsúlyozza, hogy az eszköz jelenlegi korlátai ellenére a kimenetek a felhasználók szerint előnyösebbek voltak a meglévő AI-videószintézis modellekkel szemben. Ez a fejlesztés új korszakot nyithat a vizuális tartalmak kreatív és rugalmas létrehozásában, bár a Google kutatói figyelmeztetnek a technológia visszaélésekkel és hamis vagy káros tartalmak létrehozásával szembeni kockázatára.