Midjourney bemutatta a régóta várt videó modellt
Kép forrása: Midjourney
A mesterséges intelligencia által generált képek területén úttörőnek számító Midjourney bemutatta első videógeneráló modelljét, a V1-et. Ez a régóta várt, kizárólag webes felületen elérhető rendszer forradalmasítja a tartalomgyártást azáltal, hogy bármilyen képet képes animálni 5 másodperces videóklipké, mindössze néhány nappal azután, hogy a Disney és a Universal szerzői jogok megsértése miatt pert indított a cég ellen.
- A V1 modell bármilyen képet képes videóvá alakítani, automatikus animációval vagy felhasználó által megadott parancsok alapján.
- Minden generálás négy, egyenként 5 másodperces klipet eredményez, amelyek akár 20 másodpercre is meghosszabbíthatóak, és a Midjourney szerint 25-ször olcsóbb, mint a rivális megoldások.
- A kimeneti videók hűen tükrözik a Midjourney képmodelljeinek jellegzetes stílusát, függetlenül attól, hogy a bemeneti kép a Midjourney-ből vagy külső forrásból származik.
A Midjourney, amely eddig elsősorban lenyűgöző képgeneráló képességeiről volt ismert, most belépett a videógenerálás piacára. Az újonnan bemutatott V1 modell egy jelentős lépés a vállalat számára, amely lehetővé teszi a felhasználók számára, hogy statikus képeikbe életet leheljenek.
A V1 működése és képességei
A V1 rendszer a felhasználók számára két fő lehetőséget kínál a képek animálására: automatikus animációt vagy kézi parancsok megadását. Ez utóbbi lehetővé teszi a felhasználók számára, hogy pontosan leírják a kívánt kamera mozgásokat és cselekvéseket a generált videóban, így sokkal nagyobb kreatív kontrollt biztosítva.
Minden generálási feladat négy darab 5 másodperces videóklipet eredményez. Ezek a klipek továbbfejleszthetők és akár 20 másodpercesre is meghosszabbíthatóak, ezzel növelve a felhasználási lehetőségek skáláját. A Midjourney az árazást a képgenerálási költségek nyolcszorosában határozta meg, és azt állítja, hogy ez az ár 25-ször olcsóbb, mint a piacon lévő rivális megoldások. Ez a költséghatékonyság jelentős vonzerő lehet mind az egyéni alkotók, mind a kisebb stúdiók számára.
Az új modell rendkívül rugalmas a bemeneti képek tekintetében: képes kezelni mind a Midjourney saját platformján generált képeket, mind külső forrásból származó fotókat vagy illusztrációkat. A videó kimenetek pedig hűen tükrözik a startup képmodelljeinek jellegzetes, felismerhető esztétikáját, ami megkülönbözteti őket a versenytársak termékeitől.
A jövő víziója
David Holz, a Midjourney vezérigazgatója szerint a V1 egy fontos lépcsőfok a vállalat ambiciózus célja, a valós idejű, nyílt világú szimulációk létrehozása felé. Holz hangsúlyozta, hogy ezek a komplex rendszerek kép-, videó- és 3D-modellek építőköveit igénylik, így a V1 kulcsfontosságú elem ebben a hosszú távú stratégiában.
Miért fontos ez?
Miközben más videógeneráló modellek gyakran hasonló stílusokban és esztétikákban konvergálnak, a V1 kimenetei hűek maradnak a Midjourney népszerű képmodelljeinek egyedi, jellegzetes hangulatához. Ez a vizuális koherencia különlegessé teszi a V1-et a piacon.
Fontos megjegyezni, hogy a V1 jelenleg kizárólag képből videóvá konvertál (I2V), és nincsenek hangképességei, mint például a Google Veo 3-nak. Emiatt nem versenyezhet közvetlenül a piacvezető, komplexebb videógeneráló megoldásokkal. Ennek ellenére a V1 minden bizonnyal egy izgalmas és ígéretes kezdet a vállalat jövőbeli „holodeck” víziójához, amely a digitális tartalmak teljesen új dimenzióját nyithatja meg.
Forrás: Midjourney