Martedì Dichiarazione Sora 2, il suo modello AI di sintesi video di seconda generazione che ora può creare video in vari stili, tra cui conversazioni sincronizzate ed effetti sonori, che è il primo per l’azienda. Open ha anche lanciato una nuova applicazione social iOS che consente agli utenti di chiamare “Camos” di Openi chiamandosi Sert in video esposti ai.
Openai ha mostrato il nuovo modello in un video esposto all’IA che presenta una versione fotorealistica del CEO di Openi Sam Altman, che è una gara di anatra cavalcata competitiva e un giardino di gole-fungo, alcune delle voci più innaturali del giardino.
Informazioni su quella voce, il nuovo modello può rendere l’apertura come “sofisticati paesaggi sonori di fondo, spese e effetti sonori con una realtà superiore”. A maggio, Google è diventato il primo modello di sintesi video di un importante laboratorio di intelligenza artificiale a creare video insieme all’audio sincronizzato Veo 3. Solo pochi giorni fa Alibaba è stata rilasciata WAN 2.5Un modello di video in onda aperta in grado di creare audio. Ora Open Sora 2 si è unito alla festa audio.
https://www.youtube.com/watch?v=gzneghpxwju
Open mostra la potenza di Sora 2 in un video di lancio.
Il modello ha anche una significativa continuità visiva rispetto al precedente modello video dell’Openi e può anche seguire istruzioni più complesse su più scatti mantenendo coerenza tra di loro. Il nuovo modello descrive i suoi “momenti GPT -1.5 per il video”, confronta il CHATZP con il progresso dei suoi modelli di generazione di testo nel tempo.
Sora sembra mostrare una precisione fisica avanzata sul modello Sora originale del 224 febbraio, Openai afferma che il modello può ora imitare un’attività fisica complessa come la routine di ginnastica olimpica e il triplo accele mantenendo una fisica realistica. L’anno scorso, poco dopo il lancio della Sora 1 Turbo, abbiamo visto diversi fallimenti significativi delle stesse generazioni video che affermano di essere affrontate con il nuovo modello con il nuovo modello.
Opina ha scritto nel suo annuncio: “I precedenti modelli video sono eccessivamente troppo tempo: trasformeranno la realtà per esibirsi con successo in una prompt del testo e distorcere la realtà”. “Ad esempio, se un giocatore di basket perde un tiro, la palla può spontaneamente teletrasportarsi nel cerchio. Sora 2, se un giocatore di basket perde un tiro, rimuoverà il tabellone.”















