Home Politica Nell’affollato mercato audio AI, scommesse di monitoraggio di Openai e discorso impressionante...

Politica

Nell’affollato mercato audio AI, scommesse di monitoraggio di Openai e discorso impressionante per ottenere l’adozione aziendale

29 Agosto 2025

Vorresti più informazioni intelligenti nella tua scatola in arrivo? Iscriviti solo alle nostre newsletter settimanali per ottenere la cosa importante per l’intelligenza artificiale aziendale, i dati e i leader della sicurezza. Iscriviti ora

Aperto Aggiunge un mercato audio AI sempre più competitivo per le aziende. Nuovo modello, GPT-RealtimeSegue queste istruzioni complesse e con suoni “più naturali e impressionanti”.

Mentre l’IA Voice continua a crescere e i clienti trovano situazioni come le chiamate del servizio clienti o la traduzione in tempo reale, il mercato si sta riscaldando per suoni di AI vocali realistici che offrono sicurezza delle lezioni aziendali. Openai afferma che il nuovo modello fornisce un suono più simile all’uomo, ma deve comunque competere contro aziende come ElevenLabs.

Il modello sarà disponibile nell’API reale, che la società generalmente ci rende utilizzabili. Oltre al GPT-Realtime, Open hal ha rilasciato nuove voci nell’API, chiamata Cedar e Marin, e ha aggiornato altri suoni per funzionare con l’ultimo modello.

Openai ha dichiarato in una trasmissione in diretta che lavora con i suoi clienti che creano applicazioni vocali per educare il GPT-REALTime e lo hanno reso compatibile con Evals, che hanno accuratamente costruito il modello su scenari del mondo reale come l’assistenza clienti e le lezioni accademiche ”.

Ai Stroops sui limiti di ridimensionamento

I limiti di potenza, l’aumento dei costi dei marcatori e le inferenze ritardi rimodellano AI aziendale. Unisciti alla nostra sala privata per scoprire come sono le migliori squadre:

Trasformare l’energia in un vantaggio strategico

Architetto efficiente deduzione per guadagni di resa reale

Aprire lo sblocco di un rendimento degli investimenti competitivi con sistemi AI sostenibili

Assicurati il tuo posto dove stare in futuro: https://bit.ly/4mwgngo

https://www.youtube.com/watch?v=nfbmtmjhx0

La società ha rivelato la capacità del modello di creare suoni emotivi e naturali compatibili con il modo in cui gli sviluppatori sono costruiti con la tecnologia.

Modelli di condizione di conversazione

Il modello funziona all’interno del quadro del discorso vocale e gli consente di comprendere le richieste verbali e rispondere alla voce. I modelli di discorso vocale sono ideali per le risposte in tempo reale quando una persona che è in genere un cliente interagisce con un’applicazione.

Ad esempio, un cliente desidera restituire alcuni prodotti e chiama una piattaforma di servizio clienti. Potrebbero parlare con un assistente solido AI che risponde a domande e richieste come se stessero parlando con una persona.

In uno streaming live, clienti Openai T-mobile Ha mostrato una voce AI che aiuta le persone a trovare nuovi telefoni. Un altro cliente, piattaforma di ricerca immobiliare ZillowHa esposto un agente per aiutarlo a restringere da un quartiere per trovare un posto perfetto.

Openi, Gpt-Realtime’ın “Modello audio più avanzato e pronto”, ha detto. Come altri modelli sonori, può cambiare lingue nel mezzo della frase. Tuttavia, i ricercatori di Openai hanno affermato che GPT-Realtime potrebbe seguire istruzioni più complesse come “parlare con l’accento francese”.

Tuttavia, GPT-RealTime affronta la concorrenza di altri modelli che molti marchi già usano. Elevenlabs Il discorso fatto a maggio è stato pubblicato in AI 2.0. Forte L’intelligenza artificiale collabora con franchisee di fast food per un driver audio. Startup empatico di AI Cutter Ha lanciato il modello EVI 3, che consente agli utenti di creare versioni AI delle loro voci.

Man mano che le aziende scoprono varie situazioni di utilizzo per la voce AI, i fornitori di modelli più generali offrono LLM multimodali vengono presentati per se stessi. Fattura Ha rilasciato il nuovo modello Voxstral e ha detto che avrebbe funzionato bene con la traduzione reale. Google NotBeblm, che trasforma le note di ricerca in un podcast, migliora le capacità solide con una funzione sonora e guadagna popolarità.

Segui le istruzioni migliori

Openai ha affermato che GPT-Realtime è più intelligente e compreso meglio il suono indigeno, inclusa la capacità di catturare suggerimenti non verbali come sorrisi o sospiri.

Utilizzando la revisione audio Big Bench, il confronto ha mostrato il punteggio di precisione dell’82,8% rispetto al modello precedente, che ha ottenuto un punteggio del 65,6%. Openai non ha fornito numeri che hanno testato GPT-Realtime contro i modelli dei suoi concorrenti.

Openi si è concentrato sul miglioramento delle capacità di tracciamento delle istruzioni del modello e ha permesso al modello di adattarsi in modo più efficace alle istruzioni. Il nuovo modello ottiene il 30,5% sul criterio audio multi -llenge. Gli ingegneri hanno anche cercato una funzione per GPT-Realtime per accedere ai veicoli giusti.

Aggiornamenti API reali -time

Openai ha aggiunto alcune nuove funzionalità ad Openi, per supportare il nuovo modello e per migliorare il modo in cui le aziende integrano le funzionalità AI reali nelle loro applicazioni.

Ora può supportare MCP e riconoscere gli input di immagini e consentire agli utenti di informarci ciò che vedono in tempo reale. Questa è una caratteristica che è stata ampiamente enfatizzata durante il progetto di Google dell’anno scorso durante la presentazione di Astra.

L’API reale -time può anche elaborare il protocollo di avvio della sessione (SIP). SIP collega applicazioni a telefoni come la rete telefonica generale o i telefoni da tavolo e apre più esempi di utilizzo del centro di comunicazione. Gli utenti possono anche salvare e riutilizzare le richieste nell’API.

Finora, le persone sono influenzate dal modello, ma questi sono ancora i primi test di un modello recentemente rilasciato.

TBH, MCP e SIP presentano una vera storia qui, non solo un altro modello.
La capacità di connettersi a veicoli e sistemi esterni è ciò che porterà questi modelli da demo impressionanti a flussi di lavoro reali.
Aspetto reale -tempo …
– JK (_junaidkhalid1) 28 agosto 2025

Test di GPT-REALTUE
Prima recensione:
– Sviluppo del suono notevole
– Un adesivo per le istruzioni (molto bene)
– si sente veloce pic.twitter.com/ltycs0qlxv
– Jake Colling (@jacobcolling) 28 agosto 2025

GPT-Realtime ha ricevuto un flusso dal vivo per motivi strategici, non perché la maggior parte degli utenti è interessata.
I call center sono un obiettivo importante per i fornitori di LLM e la prima azienda a raggiungere una vera svolta genererà un grande reddito.
– anko (@anko_979) 28 agosto 2025

Pro e contro @Openai Aggiornamento reale -tempo di qualcuno che si basa nel suono dell’IA:
PRO: Chiamata di funzione migliore, più emozione, 20% più economico, migliore controllo, immagine è eccezionale ma non userà
CON: Nessun suono speciale (deve avere esperienza creativa), ancora * costosa * vs tts-llm-sttt conuli
– Gavin Purcell (@gavinpurcell) 28 agosto 2025

Openi ha ridotto i prezzi per GPT-Realtime al 20% per milione di monete di input sonore e $ 64 per monete di uscita audio.

Informazioni quotidiane sull’utilizzo del business con quotidianamente ecc.

Se vuoi impressionare il tuo capo, ci sono quotidianamente, ecc. Dai turni normativi alle distribuzioni pratiche, ti diamo ciò che le aziende fanno con l’intelligenza artificiale produttiva, in modo da poter condividere informazioni per il massimo YG.

Leggi la nostra politica sulla privacy

Grazie per aver iscritto. Dai un’occhiata di più ecc.

C’è stato un errore.

Collegamento alla fonte

Facebook
Twitter
Pinterest
WhatsApp

Previous articleAmy Adams, Mia Goth, altro
Next articleNick Daicos vince il premio MVP dei giocatori; Max Gawn Manchete la squadra australiana; Call di capitano sconcertante lascia Jeremy Cameron sbalordito

Emma De Angelis
http://massacarraranews.com

RELATED ARTICLES MORE FROM AUTHOR

Egitto Trust Tutlukhamon per il risveglio del turismo

In che modo il chatbot ha ucciso le stampelle e puoi creare un libro di giochi AI Agent AI

Rooming per uova: l’epidemia di Salmonella collegata alle uova ricordate è stata malata da gennaio.

Ultimo post

Egitto Trust Tutlukhamon per il risveglio del turismo

29 Agosto 2025

Google Pixel 10 vs iPhone: design, esibizione e altro ancora

29 Agosto 2025

“Il giovedì Murder Club” spiega la fine di: chi ha ucciso...

29 Agosto 2025

ESPN Analist Packer spera per le persone Mikah dopo l’azienda

29 Agosto 2025

Round di 16 azioni di playoff Revs in Darlington

29 Agosto 2025

Quando hanno iniziato a frequentarsi Selina Gomez e Benny Blanco? La...

29 Agosto 2025

L’aggiornamento di Windows 11 25h2 colpisce la sua ultima fermata prima...

29 Agosto 2025

L’IA Rent di Zuckerberg ostacola il meta con una minaccia di...

29 Agosto 2025

In che modo il chatbot ha ucciso le stampelle e puoi...

29 Agosto 2025

Liverpool Transfer News: Alexander Isak Boost per Reds mentre Newcastle concorda...

29 Agosto 2025

Traveis Celsius, Taylor Swift Engagement: Andy Red Response

29 Agosto 2025

La da California ha chiesto un crimine

29 Agosto 2025

Categoria
Notizia4185
Sport3407
Politica3098
Cultura e spettacolo2447
Tecnologia1253
Attualità668
Finanza485