Il produttore cinese di elettronica e automobili Xiaomi ha sorpreso oggi la comunità globale dell’intelligenza artificiale Lancio di MiMo-V2-ProSi tratta di un nuovo modello base da 1 trilione di parametri con parametri di riferimento che si avvicinano a quelli dei giganti statunitensi dell’intelligenza artificiale OpenAI e Anthropic, ma costa circa un settimo o un sesto se si accede tramite API privata e, cosa più importante, invia avanti e indietro meno di 256.000 monete di informazioni.
Guidata da Fuli Luo, un veterano del dirompente progetto DeepSeek R1, questa versione rappresenta ciò che Luo descrive: "agguato silenzioso" sulla frontiera globale. Inoltre, Luo ha detto: x posta che l’azienda prevede di rendere open source una variante del modello di quest’ultima versione, " quando i modelli sono sufficientemente stabili da meritarlo."
Concentrandosi "zona di azione" sviluppo dell’intelligenza – transizione dalla generazione di codice al funzionamento autonomo delle tecnologie digitali "artigli"—Xiaomi sta cercando di trascendere completamente il paradigma conversazionale.
Prima di questa avventura nell’intelligenza artificiale di frontiera, Xiaomi, con sede a Pechino, si era affermata come un gigante. "Internet delle cose" e hardware di consumo.
Xiaomi, conosciuta a livello mondiale come il terzo produttore di smartphone al mondo, ha trascorso i primi anni del 2020 facendo un ingresso ad alto rischio nel settore automobilistico. I veicoli elettrici (EV) come il SU7 e il SUV YU7 lanciato di recente hanno trasformato l’azienda in una centrale elettrica integrata verticalmente in grado di combinare hardware, software e ragionamenti ora avanzati.
Questo pedigree nell’ingegneria del mondo fisico modella l’architettura del MiMo-V2-Pro; È stato costruito per esserlo "cervello" Sistemi complessi, sia che si tratti di gestire catene di fornitura globali o di navigare nella complessa impalcatura di un agente di codifica autonomo.
Tecnologia: l’architettura dell’agenzia
sfida centrale "Era dell’agente" gestisce ragionamenti ad alta fedeltà su intervalli di dati molto ampi senza incorrere in vincoli proibitivi "tassa sull’intelligence" in termini di ritardi o costi. MiMo-V2-Pro risolve questo problema con un’architettura sparsa: sebbene contenga 1T di parametri totali, solo 42B sono attivi durante qualsiasi passaggio in avanti, rendendolo circa tre volte più grande del precedente MiMo-V2-Flash.
L’efficienza del modello si basa su un avanzato meccanismo di attenzione ibrida. I trasformatori standard generalmente affrontano un aumento quadratico dei requisiti di calcolo man mano che il contesto cresce; MiMo-V2-Pro utilizza un rapporto ibrido 7:1 (aumentato da 5:1 nella versione Flash) per gestire un’enorme finestra di contesto token da 1 milione. Questa scelta architettonica garantisce che il modello mantenga una struttura profonda. "memoria" Esecuzione di attività di lunga durata senza il degrado delle prestazioni solitamente riscontrato nei modelli di frontiera.
Analogia: pensa al modello non come uno studente che legge un libro pagina per pagina, ma come un ricercatore esperto in una grande biblioteca. Rapporto 7:1 del modello "pendere" L’85% dei dati viene utilizzato per il contesto, mentre l’attenzione ad alta intensità viene applicata al 15% più rilevante per l’attività da svolgere.
Questo è abbinato a un leggero livello Multi-Token Prediction (MTP) che consente al modello di prevedere e generare più token contemporaneamente, riducendo notevolmente la latenza richiesta per l’elaborazione. "pensiero" Fasi dei flussi di lavoro degli agenti. Secondo Luo queste decisioni strutturali sono state prese mesi fa. "vantaggio strutturale" Per la velocità inaspettata con cui il settore si è spostato verso le agenzie.
Prodotto e confronto: controllo della realtà da parte di terzi
I dati interni di Xiaomi dipingono l’immagine di un modello superiore "mondo reale" Compiti basati su benchmark sintetici. Il MiMo-V2-Pro ha ottenuto un Elo di 1426 in GDPval-AA, un benchmark che misura le prestazioni nelle attività aziendali del mondo reale, davanti a principali concorrenti cinesi come GLM-5 (1406) e Kimi K2.5 (1283).
Mentre sono ancora sulle tracce dell’Occidente "massimo sforzo" Modelli come il Claude Sonnet 4.6 (1633) in Raw Elo rappresentano la prestazione più alta registrata per un modello di origine cinese in questa categoria.
Organizzazione di benchmarking di terze parti L’analisi sintetica ha confermato queste affermazioniPosiziona MiMo-V2-Pro al 10° posto nell’Intelligence Index globale con 49 punti. Ciò lo pone alla pari con il Codex GPT-5.2 e davanti a Grok 4.20 Beta. Questi risultati mostrano che Xiaomi ha creato con successo un modello con la capacità di ragionamento di alto livello richiesta per attività di ingegneria e produzione.
I parametri chiave di Synthetic Analysis evidenziano un salto significativo rispetto alla precedente versione openweight, MiMo-V2-Flash (che ha ottenuto 41 punti):
-
Tasso di allucinazioni: Il modello Pro ha ridotto i tassi di allucinazioni al 30%; Si tratta di un netto miglioramento rispetto al 48% del modello Flash.
-
Indice di onniscienza: Ha ricevuto +5 punti, posizionandosi davanti a GLM-5 (+2) e Kimi K2.5 (-8).
-
Efficienza dei token: MiMo-V2-Pro ha richiesto solo 77 milioni di exit token per eseguire l’intero Intelligence Index; questo era significativamente inferiore a GLM-5 (109M) o Kimi K2.5 (89M), indicando un processo di ragionamento più breve ed efficiente.
Anche le classifiche di Xiaomi lo evidenziano "Rappresentante Generale" E "Agente di codifica" Abilità. In ClawEval, un punto di riferimento per gli scaffold delle agenzie, il modello ha ottenuto 61,5, avvicinandosi alle prestazioni di Claude Opus 4.6 (66,3) e superando significativamente GPT-5.2 (50,0). Ha raggiunto 86,7 in ambienti specifici della codifica come Terminal-Bench 2.0; Ciò significa elevata affidabilità durante l’esecuzione di comandi in un ambiente terminale live.
In che modo le aziende dovrebbero valutare l’utilizzo di MiMo-V2-Pro?
Per quelli delineati nelle organizzazioni contemporanee di intelligenza artificiale, dall’infrastruttura alla sicurezza, MiMo-V2-Pro rappresenta un cambio di paradigma. "Prezzo-Qualità" curva.
I decisori infrastrutturali troveranno MiMo-V2-Pro un candidato interessante per la frontiera di Pareto tra intelligenza e costi. Artificial Analysis riporta che la gestione dei suoi indici costa solo $ 348 per MiMo-V2-Pro, $ 2.304 per GPT-5.2 e $ 2.486 per Claude Opus 4.6.
Per le organizzazioni che gestiscono cluster o forniture GPU, la possibilità di accedere alle prime 10 informazioni globali a circa 1/7 del costo degli operatori storici occidentali rappresenta un forte incentivo per i test su scala di produzione.
I decision maker sui dati possono sfruttare 1 milione di finestre di contesto per architetture predisposte per RAG, consentendo loro di alimentare intere basi di codici aziendali o set di documenti in un’unica richiesta, senza la frammentazione richiesta da modelli di contesto più piccoli.
Un decisore di sistema/disposizione dovrebbe considerare MiMo-V2-Pro come primario "cervello" Per il coordinamento multi-agente. Poiché il modello è ottimizzato per OpenClaw e Claude Code, può gestire la pianificazione a lungo termine e gli strumenti di precisione senza il costante intervento umano osservato nei modelli precedenti.
Il suo alto posizionamento in GDPval-AA indica che è particolarmente adatto per il flusso di lavoro e il livello di orchestrazione necessari per scalare l’intelligenza artificiale in tutta l’azienda. Consente la creazione di sistemi in grado di andare oltre la semplice automazione fino alla risoluzione di problemi complessi e in più fasi.
Ma i decisori in materia di sicurezza devono prestare attenzione. Molto "agente" La natura potente del modello (la capacità di utilizzare terminali e gestire file) aumenta la superficie per l’iniezione rapida e l’accesso non autorizzato al modello.
Mentre il basso tasso di allucinazioni (30%) è un vantaggio per la difesa, la mancanza di pesi pubblici (a differenza della versione Flash) significa che i team di sicurezza interna non possono effettuare attacchi profondi "a livello di modello" A volte possono essere necessari controlli per distribuzioni altamente sensibili. Qualsiasi implementazione aziendale deve essere accompagnata da solidi protocolli di monitoraggio e verificabilità.
Prezzi, disponibilità e prospettive future
Xiaomi ha fissato il prezzo del MiMo-V2-Pro per dominare il mercato degli sviluppatori. I prezzi sono scaglionati in base all’utilizzo del contesto, con tariffe competitive per la memorizzazione nella cache per supportare attività di ragionamento ad alta frequenza.
-
MiMo-V2-Pro (fino a 256K): $ 1 per 1 milione di token di input e $ 3 per 1 milione di token di output
-
MiMo-V2-Pro (256K-1M): $ 2 per 1 milione di token di ingresso e $ 6 per 1 milione di token di uscita
-
Lettura della cache: $ 0,20 per 1 milione di token per il livello inferiore e $ 0,40 per il livello superiore
-
Scrivi nella cache: Temporaneamente gratuito ($ 0)
Ecco come si confronta con altri principali modelli di confine in tutto il mondo:
|
Modello |
Entrata |
Uscita |
Costo totale |
Fonte |
|
Grok 4.1 Veloce |
$ 0,20 |
$ 0,50 |
$ 0,70 |
|
|
MiniMax M2.7 |
$ 0,30 |
$ 1,20 |
$ 1,50 |
|
|
Gemelli 3 Il Flash |
$ 0,50 |
$ 3,00 |
$ 3,50 |
|
|
Kimi-K2.5 |
$ 0,60 |
$ 3,00 |
$ 3,60 |
|
|
MiMo-V2-Pro (≤256K) |
$ 1,00 |
$ 3,00 |
$ 4,00 |
|
|
GLM-5-Turbo |
$ 0,96 |
$ 3,20 |
$ 4,16 |
|
|
GLM-5 |
$ 1,00 |
$ 3,20 |
$ 4,20 |
|
|
ClaudeHaiku4.5 |
$ 1,00 |
$ 5,00 |
$ 6,00 |
|
|
Qwen3-Max |
$ 1,20 |
$ 6,00 |
$ 7,20 |
|
|
Gemelli 3 Pro |
$ 2,00 |
$ 12,00 |
$ 14,00 |
|
|
GPT-5.2 |
$ 1,75 |
$ 14,00 |
$ 15,75 |
|
|
GPT-5.4 |
$ 2,50 |
$ 15,00 |
$ 17,50 |
|
|
Claude Sonetto 4.5 |
$ 3,00 |
$ 15,00 |
$ 18,00 |
|
|
Chiudi Esegui 4.6 |
$ 5,00 |
$ 25,00 |
$ 30,00 |
|
|
GPT-5.4 Professionale |
$ 30,00 |
$ 180,00 |
$ 210,00 |
Questo posizionamento aggressivo è progettato per incoraggiare i flussi di applicazioni ad alta densità che definiscono la prossima generazione di software. Il modello è attualmente disponibile solo tramite l’API proprietaria di Xiaomi, senza display corrente o supporto di input multimodale; Questa è un’omissione notevole in un’epoca. "Omni" modelli, ma Xiaomi ha introdotto un MiMo-V2-Omni separato per queste esigenze.
"Cacciatore Alfa" Il periodo trascorso presso OpenRouter ha dimostrato che il mercato ha un grande appetito per questa speciale miscela di efficienza e ragionamento. La filosofia di Fuli Luo; velocità di ricerca "vero amore per il mondo per cui hai costruito"– risultando in un modello che si colloca al 2° posto in Cina e all’8° a livello globale negli indici di intelligence consolidati.
Se rimane uno "silenzio" Il fatto che possa tendere un’imboscata o diventare la base per un riallineamento globale del potere dell’IA dipende dalla rapidità con cui gli sviluppatori abbracciano l’IA. "zona di azione" SU "finestra di chat". Per ora Xiaomi ha spostato i paletti: la questione non è più solo "può parlare?" Tuttavia "Può muoversi?"















