La società cinese Moonshot AI ha aggiornato il modello open source Kimi K2 e lo ha trasformato in un modello di codifica e visione con un’architettura che supporta l’orchestrazione dello sciame di agenti.
Il nuovo modello Moonshot Kimi K2.5 è una buona opzione per le aziende che desiderano agenti in grado di trasferire le azioni automaticamente anziché avere un quadro decisionale centralizzato.
L’azienda descrive Kimi K2.5 come un “modello all-in-one” che supporta sia input visivi che testuali, consentendo agli utenti di sfruttare il modello per più progetti di codifica visiva.
Moonshot non ha rivelato pubblicamente il numero di parametri del K2.5, ma il modello Kimi K2 su cui si basava aveva un totale di 1 trilione di parametri e 32 miliardi di parametri abilitati, grazie alla sua architettura ibrida di esperti.
È l’ultimo modello open source che offre un’alternativa alle opzioni più chiuse di Google, OpenAI e Anthropic e le supera su parametri chiave come flussi di lavoro di intermediazione, codifica e visione.
SU L’ultimo esame dell’umanità (HLE) Criterio: qualche punteggio K2.5 50,2% (con strumenti) supera GPT-5.2 (xhigh) di OpenAI e Claude Opus 4.5. Anche ottenuto 76,8% Aprire Panca SWE VerificatoSebbene GPT-5.2 e Opus 4.5 lo battano qui con punteggi rispettivamente di 80 e 80,9, consolida il suo status di modello di codifica di alto livello.
Kimi K2 e Kimi K2 Thinking, lanciati all’inizio di novembre, hanno visto un aumento del 170% degli utenti tra settembre e novembre, ha affermato Moonshot in un comunicato stampa.
Sciame di agenti e orchestrazione integrata
Moonshot mira a sfruttare gli agenti autodiretti e il paradigma dello sciame di agenti integrati in Kimi K2.5. Lo sciame di agenti è stato pubblicizzato come la prossima frontiera nello sviluppo di intelligenza artificiale aziendale e nei sistemi basati su agenti. Ha attirato grande attenzione negli ultimi mesi.
Per le aziende, ciò significa che possono aspettarsi di crescere in modo più efficiente se creano ecosistemi di broker con Kimi K2.5. Ma invece di aumentare lo “scaling up” o aumentare le dimensioni del modello per creare agenti più grandi, l’attenzione si concentra principalmente sulla creazione di più agenti in grado di gestirsi da soli.
Some K2.5 “crea e coordina un insieme di agenti esperti che lavorano in parallelo”. L’azienda lo ha paragonato a un alveare in cui ciascun agente svolge un compito contribuendo al contempo a un obiettivo comune. Il modello impara ad autogestire fino a 100 subagenti e può eseguire flussi di lavoro paralleli fino a 1.500 chiamate di agenti.
“I benchmark raccontano solo metà della storia. Moonshot AI ritiene che l’AGI dovrebbe in definitiva essere giudicata in base alla sua capacità di completare le attività del mondo reale in modo efficiente e con vincoli di tempo reali. La vera metrica a cui tengono è: quanta parte della tua giornata ti ha effettivamente restituito l’intelligenza artificiale? Lavorare in parallelo riduce drasticamente il tempo richiesto per un’attività complessa; attività che prima richiedevano giorni di lavoro possono ora essere completate in pochi minuti”, ha affermato l’azienda.
Le organizzazioni che prendono in considerazione strategie normative hanno iniziato a guardare a piattaforme intermediarie in cui gli agenti comunicano e delegano compiti, piuttosto che seguire un rigido quadro normativo che determina quando un’azione viene completata.
Sebbene K2.5 presenti un’opzione interessante per le organizzazioni che desiderano utilizzare questa forma di orchestrazione, alcune potrebbero sentirsi più a loro agio evitando l’orchestrazione basata su agenti aggiunta al modello e utilizzando invece una piattaforma diversa per separare la formazione del modello dall’attività mediata.
Questo perché le aziende spesso desiderano una maggiore flessibilità nei modelli in cui creano i propri agenti, in modo da poter creare un ecosistema di agenti che sfruttano i LLM che funzionano meglio per azioni specifiche.
Alcune piattaforme di agenti, come Salesforce, AWS Bedrock e IBM, offrono strumenti separati di osservabilità, gestione e monitoraggio che consentono agli utenti di organizzare e interagire con agenti AI costruiti con modelli diversi.
Codifica multimodale e debug visivo
Kimi K2.5 eccelle anche nella codifica, affermando di essere “il modello open source più potente per la codifica di immagini fino ad oggi”.
Il modello consente agli utenti di codificare layout visivi, comprese interfacce utente e interazioni. Ragiona attraverso immagini e video per comprendere le attività codificate nell’input visivo. Ad esempio, K2.5 può ricostruire il codice di un sito web analizzando la registrazione video del sito in azione, trasformando segnali visivi in layout e animazioni interattive.
“Interfacce, layout e interazioni difficili da descrivere completamente nel linguaggio possono essere trasmessi attraverso screenshot o registrazioni di schermate che il modello può interpretare e trasformare in siti Web completamente funzionali. Ciò consente una nuova classe di esperienze di codifica delle vibrazioni”, ha affermato Moonshot.
Questa funzionalità è integrata in Kimi Code, un nuovo strumento basato su terminale che funziona con IDE come VSCode e Cursor.
Supporta "debug visivo autonomo," dove il modello ispeziona visivamente il suo output (ad esempio, una pagina web renderizzata), fa riferimento alla documentazione e itera il codice per correggere modifiche al layout o errori estetici senza intervento umano.
A differenza di altri modelli multimodali in grado di eseguire il rendering e comprendere le immagini, Kimi K2.5 può creare interazioni front-end per siti Web che includono immagini e non solo il codice sottostante.
Prezzi dell’API
Per competere con i principali laboratori negli Stati Uniti, Moonshot AI ha fissato un prezzo aggressivo per l’API K2.5, offrendo sconti significativi rispetto al precedente modello K2 Turbo.
-
Entrata: $ 0,60 per milione di monete (uno 47,8% ridurre).
-
Voce memorizzata nella cache: $ 0,10 per milione di monete (uno 33,3% ridurre).
-
Uscita: $ 3,00 per milione di monete (uno 62,5% ridurre).
Il basso costo delle voci memorizzate nella cache ($ 0,10/milione di monete) si applica specificamente a: "Agente Sciame" Funzionalità che richiedono strumenti estesi e la manutenzione di ampie finestre di contesto, spesso su più agenti secondari.
Licenza MIT modificata
Sebbene K2.5 sia open source, viene rilasciato sotto la licenza modificata del MIT, che include una clausola di targeting specifica. "scala estrema" utenti commerciali.
La licenza concede autorizzazioni standard per utilizzare, copiare, modificare e vendere il software.
Tuttavia, stabilisce che se il software o qualsiasi lavoro derivato viene utilizzato per un prodotto o servizio commerciale con più di 100 milioni di utenti attivi mensili (MAU) o più di 20 milioni di dollari di entrate mensili, l’organizzazione deve essere ben visibile. "come K2.5" nell’interfaccia utente.
Questa clausola garantisce che il modello rimanga gratuito e aperto alla stragrande maggioranza della comunità di sviluppatori e delle start-up, garantendo al tempo stesso che i principali giganti della tecnologia non possano etichettare in bianco la tecnologia di Moonshot senza fornire un’attribuzione visibile.
non pieno "fonte aperta" ma migliore della controparte di Meta Termini di licenza lama per lui "fonte aperta" Famiglia di modelli che richiede alle aziende con 700 milioni o più di utenti mensili di ottenere una speciale licenza operativa dall’azienda.
Cosa significa questo per i moderni sviluppatori di intelligenza artificiale aziendale?
Per i professionisti che definiscono il moderno stack di intelligenza artificiale, dai decisori LLM che ottimizzano i cicli di implementazione ai leader dell’orchestrazione dell’intelligenza artificiale che implementano agenti e processi aziendali automatizzati basati sull’intelligenza artificiale, Kimi K2.5 rappresenta un cambiamento fondamentale nella leva finanziaria.
Incorporando l’orchestrazione dello sciame direttamente nel modello, Moonshot AI fornisce effettivamente a questi costruttori con risorse limitate una forza lavoro sintetica, consentendo a un singolo ingegnere di gestire un centinaio di subagenti autonomi con la stessa facilità di un singolo prompt dei comandi.
Questo "ingrandirsi" L’architettura affronta direttamente il dilemma dei decisori relativi ai dati di bilanciare pipeline complesse con un numero limitato di dipendenti, mentre la struttura dei prezzi ridotta trasforma l’elaborazione dei dati ad alto contesto da un lusso che riduce il budget a una merce di routine.
In definitiva, K2.5 propone un futuro in cui il vincolo principale per un team di ingegneri non è più il numero di persone che utilizzano le tastiere, ma la capacità dei loro leader di coreografare uno sciame.














