Cursor, la piattaforma di codifica AI di San Francisco della startup Anysphere del valore di 29,3 miliardi di dollariiniziato Compositore 2è un nuovo modello di codifica on-premise ora disponibile nel proprio ambiente di codifica AI dell’agenzia, che offre benchmark notevolmente migliorati rispetto al precedente modello on-premise.

Iniziare e fare allo stesso tempo Compositore 2 Veloceè una variante più costosa ma più veloce ed è l’esperienza predefinita per gli utenti.

Ecco la ripartizione dei costi:

  • Compositore 2 Standard: $ 0,50/$ 2,50 per 1 milione di token in entrata/uscita

  • Compositore 2 Veloce: $ 1,50/$ 7,50 per 1 milione di token in entrata/uscita

Si tratta di un grande calo rispetto al precedente modello locale di Cursor. Compositore 1.5, da febbraio$ 3,50 per milione di token di input e $ 17,50 per milione di token di output; Il compositore 2 costa circa l’86% in meno in entrambi i casi.

Compositore 2 Veloce anche approssimativamente 57% più economico rispetto a Composer 1.5.

Ci sono anche sconti "prezzi di lettura della cache," ovvero restituendo alcuni degli stessi token al modello in un prompt a $ 0,20 per milione per Composer 2 e $ 0,35 per milione per Composer 2 Fast e $ 0,35 per milione per Composer 1.5.

È anche importante che questa sembri essere una versione locale di Cursor, non un modello autonomo ampiamente distribuito. L’annuncio dell’azienda e la documentazione del modello affermano che Composer 2 è disponibile in Cursor, che Cursor è adattato al flusso di lavoro dell’agente e che si integra con lo stack di strumenti del prodotto.

I materiali forniti non indicano disponibilità separata tramite piattaforme di modelli esterni o come API generica al di fuori dell’ambiente Cursor.

Il cursore promuove la codifica a lungo orizzonte, non solo i completamenti migliori

L’affermazione tecnica più profonda in questa versione non è solo che Composer 2 ottiene punteggi più alti di Composer 1.5. Cursor afferma che il modello è più adatto alla codifica mediata a lungo orizzonte.

Cursor afferma sul suo blog che i miglioramenti in termini di qualità sono arrivati ​​dal primo studio di pre-formazione continua, che gli ha fornito una base più solida per l’apprendimento per rinforzo su larga scala. Da qui, l’azienda afferma di addestrare Composer 2 su attività di codifica a lungo termine e che il modello può risolvere problemi che richiedono centinaia di azioni.

Questa inquadratura è importante perché tocca uno dei maggiori problemi irrisolti nella codifica AI. Molti modelli sono efficaci nel generare codice isolato. Molto meno rimane affidabile in un flusso di lavoro più lungo che prevede la lettura di un archivio dati, la decisione su cosa modificare, la modifica di più file, l’esecuzione di comandi, l’interpretazione degli errori e il progresso verso un obiettivo.

La documentazione di Cursor rafforza il fatto che questo è il caso d’uso a cui tiene. Descrive Composer 2 come un modello intermedio con una finestra di contesto da 200.000 token, ottimizzata per l’uso degli strumenti, la modifica dei file e le operazioni del terminale all’interno del cursore.

Sottolinea anche tecniche di allenamento come l’autoassorbimento per compiti di lunga durata. Per gli sviluppatori che già utilizzano Cursor come ambiente principale, questa messa a punto più rigorosa potrebbe essere più importante che rivendicare una classifica generica.

Anche se GPT-5.4 è ancora in vantaggio nel grafico base, i guadagni del benchmark sono significativi

I risultati pubblicati da Cursor mostrano un netto miglioramento rispetto ai precedenti modelli Composer. L’azienda elenca Composer 2 a 61,3 in CursorBench, 61,7 in Terminal-Bench 2.0 e 73,7 in SWE-bench Multilingual.

Questo si confronta con Composer 1.5 a 44.2, 47.9 e 65.9 e Composer 1 a 38.0, 40.0 e 56.9.

Il rilascio è più contenuto rispetto al lancio di alcuni modelli perché Cursor non rivendica la leadership universale.

In Terminal-Bench 2.0, che misura la capacità di un agente AI di eseguire attività nelle interfacce in stile terminale a riga di comando, GPT-5.4 è ancora avanti con 75,1 punti, mentre Composer 2 è avanti con 61,7 punti, davanti a Opus 4.6 (58,0), Opus 4.5 (52,1) e Composer 1.5 (47,9).

Ciò rende la presentazione di Cursor più pragmatica e forse più utile per i destinatari. L’azienda non sta dicendo che Composer 2 sia il modello migliore sotto ogni aspetto. Ciò sposta il modello a un livello di qualità più competitivo, afferma, offrendo allo stesso tempo aspetti economici più interessanti e una maggiore integrazione che gli sviluppatori di prodotti stanno già utilizzando.

Cursor ha anche incluso un grafico costi-prestazioni nella sua suite di benchmark CursorBench che sembra progettato per creare un argomento in stile Pareto per Composer 2.

In questo grafico, Composer 2 si trova in una posizione di rapporto costo-prestazioni migliore rispetto a Composer 1.5, e si confronta favorevolmente con le impostazioni GPT-5.4 e Opus 4.6 a costo più elevato presentate da Cursor. Il messaggio dell’azienda non è solo che Composer 2 ottiene punteggi più alti rispetto al suo predecessore, ma che può anche offrire un equilibrio più efficiente tra costi e informazioni per il lavoro quotidiano di codifica in Cursor.

Perché il punto di “blocco del cursore” è importante per gli acquirenti?

La domanda più importante per i lettori che devono decidere se utilizzare Composer 2 potrebbe non essere solo la prestazione di riferimento. È possibile che desiderino un modello ottimizzato per l’esperienza del prodotto del Cursore.

Questo può essere un punto di forza. Secondo la documentazione, Composer 2 può accedere allo stack di strumenti intermedi di Cursor, tra cui ricerca di codice semantico, ricerca di file e cartelle, lettura di file, modifica di file, comandi shell, controllo del browser e accesso web.

Se l’obiettivo è completare attività software reali anziché produrre risposte straordinarie una tantum, questo tipo di integrazione potrebbe essere più prezioso della qualità grezza del modello.

Ma restringe anche il pubblico a cui rivolgersi. I team alla ricerca di un modello da poter distribuire ampiamente su più strumenti e piattaforme esterni dovrebbero comprendere che Cursor offre Composer 2 come modello per gli utenti Cursor, non come modello base autonomo generalmente disponibile.

Immagine grande: il cursore ha una discussione operativa

L’importanza di Composer 2 non è che Cursor abbia improvvisamente preso il primo posto in ogni criterio di codifica. Non. Il punto più importante è che Cursor fornisce un argomento operativo: il suo modello sta migliorando, il suo prezzo è sufficientemente basso da incoraggiarne un uso più ampio e il suo livello più veloce è sufficientemente reattivo da consentire all’azienda di renderlo predefinito nonostante il costo più elevato.

Questa combinazione potrebbe entrare in risonanza con i team di ingegneri che si preoccupano sempre meno del prestigio del modello astratto e più della possibilità che un assistente possa essere utile durante lunghe sessioni di codifica senza essere proibitivamente costoso.

Cursore più largo struttura dei prezzi questo aiuta a inquadrare la pressione competitiva attorno al lancio. Cursor offre un livello Hobby gratuito nella sua pagina dei prezzi attuale. Piano Pro da $ 20 al mese, Pro+ $ 60 al meseE Ultra $ 200 al mese Per singoli utenti, con livelli più alti che offrono un maggiore utilizzo tra i modelli OpenAI, Anthropic e Google.

Dal lato commerciale, Teams costa $ 40 per utente al meseEnterprise ha un prezzo speciale e aggiunge utilizzo in pool, fatturazione centralizzata, analisi dell’utilizzo, controlli della privacy, SSO, registri di controllo e controlli amministrativi granulari. In altre parole, Cursor non addebita solo l’accesso a un modello di codifica. Fa pagare un livello di applicazione gestita che si sovrappone a più fornitori di modelli aggiungendo funzionalità del team, strumenti di governance e flusso di lavoro.

Questo modello è sottoposto a una pressione crescente man mano che le aziende di intelligenza artificiale proprietarie approfondiscono la codifica. OpenAI e Anthropic non vendono più modelli esclusivamente tramite prodotti di terze parti; forniscono inoltre le proprie interfacce di codifica, broker e strutture di valutazione, come Codex e Claude Code, il che solleva la questione di quanto spazio sia lasciato per una piattaforma intermediaria.

Revisori attivi

Mentre alcuni di questi post descrivono delusione per i prezzi di Cursor, perdita di contesto o esperienza incentrata sull’editor, Claude elogia Code come un modo di lavorare più diretto e completamente mediato. Anche se considerate attentamente, tali conversazioni sociali evidenziano il problema strategico che Cursor deve affrontare: deve dimostrare che la sua piattaforma integrata, i controlli del team e ora i suoi modelli interni aggiungono abbastanza valore da giustificare il fatto di sedersi tra i prodotti di codifica sempre più capaci di sviluppatori e creatori di modelli.

Ciò rende Composer 2 strategicamente importante per Cursor.

Offrendo un modello interno molto più economico rispetto a Composer 1.5, confrontandolo strettamente con lo stack di strumenti di Cursor e rendendo predefinita una versione più veloce, l’azienda sta cercando di dimostrare che fornisce più di un semplice wrapper attorno ai sistemi esterni.

La sfida è che con l’evoluzione dei prodotti di codifica di prima parte, gli sviluppatori e gli acquirenti aziendali potrebbero chiedersi sempre più se desiderano una piattaforma di codifica AI separata o se i creatori di modelli sono diventati autosufficienti nei loro strumenti.

Collegamento alla fonte