Az OpenAI, a mesterséges intelligencia kutatásának egyik élvonalbeli szereplője, most egy újabb jelentős lépéssel előrébb viszi a technológia határait. A cég bejelentette a Sora nevű videógeneráló modelljét, ami képes szöveges utasítások alapján realisztikus és képzeletgazdag jeleneteket létrehozni. Ez a fejlesztés új távlatokat nyit a videók készítésében, lehetővé téve a felhasználók számára, hogy írott promptjaik alapján akár egyperces, fotorealisztikus videókat hozzanak létre.

A Sora, az OpenAI legújabb mesterséges intelligenciája: szövegből videót varázsol

A Sora különlegessége abban rejlik, hogy összetett jeleneteket képes létrehozni több szereplővel, specifikus mozgástípusokkal, valamint pontosan megragadja a tárgyak és a háttér részleteit. Az OpenAI szerint a modell megérti, hogy az objektumok hogyan léteznek a fizikai világban, képes az eszközök pontos értelmezésére, és meggyőző karaktereket hoz létre, amelyek élénk érzelmeket fejeznek ki.

Az újítás nem áll meg itt: a Sora képes egy állókép alapján videót generálni, hiányzó képkockákat pótolni egy meglévő videóban, vagy azt meghosszabbítani. Az OpenAI blogbejegyzésében bemutatott demók között szerepel egy kaliforniai aranyláz idején készült légi felvétel, egy tokiói vonaton belülről készült videó, és még több hasonló. Bár vannak nyilvánvaló AI-jellegű elemek, mint például egy múzeumi videó gyanús padlómozgása, az eredmények mindent egybevetve lenyűgözőek.

A Sora modell egyelőre csak biztonsági szakértők számára hozzáférhető, akik felmérik, hogy a program milyen negatív következményekkel vagy veszélyekkel járhat. Az OpenAI ezenkívül kéri a visszajelzéseket olyan szakmák képviselőitől, mint a vizuális művészek, tervezők és filmrendezők. A jelenlegi változatban előfordulhat, hogy a modell nem képes tökéletesen leutánozni egy bonyolult jelenet fizikai törvényeit, vagy nem értelmez helyesen bizonyos okok és következmények közötti összefüggéseket.

Az OpenAI bevezetett egy biztonsági jelzést a DALL-E 3 nevű képeket készítő programjába, ami segít azonosítani a gép által készített képeket a valódiaktól. Viszont megjegyezték, hogy ezek a biztonsági jelzések könnyen eltávolíthatók. Ahogy más mesterséges intelligencia által készített termékeiknél is, az OpenAI-nak szembe kell néznie azzal a kihívással, hogy az általa létrehozott, élethű videókat tévesen valóságosnak tarthatják az emberek.