Kezdőlap Mesterséges inteligencia A Sora, az OpenAI legújabb mesterséges intelligenciája: szövegből videót varázsol

A Sora, az OpenAI legújabb mesterséges intelligenciája: szövegből videót varázsol

Írta:

2024.02.15.

331

Az OpenAI, a mesterséges intelligencia kutatásának egyik élvonalbeli szereplője, most egy újabb jelentős lépéssel előrébb viszi a technológia határait. A cég bejelentette a Sora nevű videógeneráló modelljét, ami képes szöveges utasítások alapján realisztikus és képzeletgazdag jeleneteket létrehozni. Ez a fejlesztés új távlatokat nyit a videók készítésében, lehetővé téve a felhasználók számára, hogy írott promptjaik alapján akár egyperces, fotorealisztikus videókat hozzanak létre.

A Sora különlegessége abban rejlik, hogy összetett jeleneteket képes létrehozni több szereplővel, specifikus mozgástípusokkal, valamint pontosan megragadja a tárgyak és a háttér részleteit. Az OpenAI szerint a modell megérti, hogy az objektumok hogyan léteznek a fizikai világban, képes az eszközök pontos értelmezésére, és meggyőző karaktereket hoz létre, amelyek élénk érzelmeket fejeznek ki.

Az újítás nem áll meg itt: a Sora képes egy állókép alapján videót generálni, hiányzó képkockákat pótolni egy meglévő videóban, vagy azt meghosszabbítani. Az OpenAI blogbejegyzésében bemutatott demók között szerepel egy kaliforniai aranyláz idején készült légi felvétel, egy tokiói vonaton belülről készült videó, és még több hasonló. Bár vannak nyilvánvaló AI-jellegű elemek, mint például egy múzeumi videó gyanús padlómozgása, az eredmények mindent egybevetve lenyűgözőek.

here is sora, our video generation model:https://t.co/CDr4DdCrh1

today we are starting red-teaming and offering access to a limited number of creators.@_tim_brooks @billpeeb @model_mechanic are really incredible; amazing work by them and the team.

remarkable moment.

— Sam Altman (@sama) February 15, 2024

A Sora modell egyelőre csak biztonsági szakértők számára hozzáférhető, akik felmérik, hogy a program milyen negatív következményekkel vagy veszélyekkel járhat. Az OpenAI ezenkívül kéri a visszajelzéseket olyan szakmák képviselőitől, mint a vizuális művészek, tervezők és filmrendezők. A jelenlegi változatban előfordulhat, hogy a modell nem képes tökéletesen leutánozni egy bonyolult jelenet fizikai törvényeit, vagy nem értelmez helyesen bizonyos okok és következmények közötti összefüggéseket.

Az OpenAI bevezetett egy biztonsági jelzést a DALL-E 3 nevű képeket készítő programjába, ami segít azonosítani a gép által készített képeket a valódiaktól. Viszont megjegyezték, hogy ezek a biztonsági jelzések könnyen eltávolíthatók. Ahogy más mesterséges intelligencia által készített termékeiknél is, az OpenAI-nak szembe kell néznie azzal a kihívással, hogy az általa létrehozott, élethű videókat tévesen valóságosnak tarthatják az emberek.

Kövesd a Mobilissimo-t a Google Hírekben itt:

A Sora, az OpenAI legújabb mesterséges intelligenciája: szövegből videót varázsol

TESZTEK

Meglepő fordulat az AnTuTu decemberi toplistáján: a Xiaomi eltűnt, a Red Magic 10 Pro+ az élen zárja 2024-et

A realme Neo7 lenyűgöző 2,4 milliós AnTuTu pontszámmal érkezik: nagy teljesítmény és 7000 mAh akkumulátor

Új gaming király: Nubia Red Magic 10 Pro+ és a 3 milliós AnTuTu eredmény

NÉPSZERŰ BEJEGYZÉSEK

A Snapdragon 8 Elite Gen 2 benchmark alapján 40%-kal gyorsabb lehet, mint az elődje; 3,8 milliós AnTuTu pontszámról szólnak a pletykák

A POCO F7 Ultra játékosoknak szánt mobil lett; brutális teljesítmény és 8K videó egyben

A SpaceX rakétáival szállítana katonai csomagokat világszerte 90 perc alatt az amerikai légierő; a Rocket Cargo Vanguard tesztje Johnston Islanden indulna

POPULAR CATEGORY

RÓLUNK

KÖVESS MINKET

A Google mostantól elérhetővé teszi a Gemini MI funkcióit az iOS-es...