Quasi un anno dopo il rilascio di Rerank 3.5, Cohere ha lanciato l’ultima versione del suo modello di ricerca, ora con una finestra di contesto più ampia per aiutare gli agenti a trovare le informazioni di cui hanno bisogno per completare le loro attività.
Coerente ha detto un post sul blog Il riclassificazione 4 ha finestre di contesto da 32.000, che rappresentano un aumento quadruplicato rispetto a 3.5.
“Ciò consente al modello di elaborare documenti più lunghi, valutare più passaggi contemporaneamente e acquisire relazioni tra sezioni che le finestre più brevi non potrebbero perdere”, secondo il post sul blog. “Questa capacità ampliata aumenta quindi la precisione di smistamento per tipi di documenti realistici e aumenta la fiducia nella pertinenza dei risultati ricevuti”.
Rerank 4 ha due varianti: Veloce e Pro. Un modello più piccolo, Fast è più adatto per i casi d’uso che richiedono velocità e precisione, come l’e-commerce, la pianificazione e il servizio clienti. Pro è ottimizzato per attività che richiedono ragionamento, precisione e analisi più approfonditi, come la creazione di modelli di rischio e l’esecuzione di analisi dei dati.
La ricerca aziendale è diventata più importante quest’anno, soprattutto perché i rappresentanti dell’IA devono accedere a più informazioni e contesto sull’organizzazione per cui lavorano. Cohere ha affermato che i rirank “aumentano in modo significativo la precisione della ricerca AI aziendale migliorando i risultati di accesso iniziali”. Rerank 4 affronta il divario di sfumature creato da alcuni incorporamenti di dual-coder (modelli che aiutano a facilitare l’acquisizione di attività di generazione aumentata (RAG) – utilizzando un’architettura di transcoder che “elabora congiuntamente query e candidati, cattura sottili relazioni semantiche e riorganizza i risultati per rivelare gli elementi più rilevanti”, ha affermato Cohere.
Prestazioni e benchmark
Cohere ha confrontato i modelli con altri modelli di riclassificazione come Qwen Reranker 8B, Jina Rerank v3 di Elasticsearch e Voyage Rerank 2.5 di MongoDB su attività nel settore finanziario, sanitario e manifatturiero. Rerank 4 ha ottenuto ottimi risultati, se non migliori, rispetto ai suoi concorrenti.
Rerank 3.5 si è distinto per la sua capacità di supportare più lingue e Cohere ha affermato che Rerank 4 continua questa tendenza. Comprende oltre 100 lingue, incluso l’accesso all’avanguardia nelle 10 principali lingue commerciali.
Agenti e modelli di riordino
Lo scopo di Rerank 4 è fornire più contesto e aiutare le attività degli agenti a comprendere quali dati si adattano meglio alle loro attività.
Il modello è un componente chiave della piattaforma AI dell’agenzia North perché “si integra perfettamente con le soluzioni di ricerca AI esistenti, inclusi sistemi ibridi, vettoriali e basati su parole chiave, con modifiche minime al codice”, ha affermato Cohere.
Man mano che sempre più organizzazioni iniziano a utilizzare intermediari per la ricerca e l’analisi, come evidenziato dall’aumento delle funzionalità di ricerca approfondita, i modelli che aiutano a filtrare i contenuti irrilevanti, come i riclassificamenti, stanno diventando più importanti.
“Ciò è particolarmente efficace per l’intelligenza artificiale delle agenzie, dove interazioni complesse e in più fasi possono rapidamente accelerare le chiamate di modelli e saturare le finestre di contesto”, ha affermato Cohere.
L’azienda sostiene che Rerank 4 impedisce alle informazioni di bassa qualità di raggiungere LLM, contribuendo a ridurre l’utilizzo dei token e il numero di tentativi di cui un agente ha bisogno per fare le cose per bene.
autoapprendimento
Cohere ha affermato che Rerank 4 si distingue non solo per le sue potenti capacità di riclassificazione, ma anche per essere il primo modello di riclassificazione ad autoapprendimento.
Gli utenti possono personalizzare Rerank 4 per i casi d’uso che incontrano più frequentemente, senza dati annotati. Similmente ai modelli di base come GPT-5.2, in cui le persone possono specificare le proprie preferenze e il modello le ricorda, gli utenti di Rerank 4 possono indicare al modello i tipi di contenuto e le raccolte di documenti che preferiscono.
Ad esempio, se utilizzato con Rerank 4 Fast, il modello diventa più competitivo rispetto ai modelli più grandi poiché è più accurato e accede ai dati specifici desiderati dagli utenti.
“Guardando più avanti, abbiamo anche esplorato il modo in cui la capacità di autoapprendimento di Rerank 4 funziona in domini di ricerca completamente nuovi”, ha affermato Cohere. “Utilizzando set di dati incentrati sull’assistenza sanitaria che imitano l’esigenza del medico di recuperare informazioni specifiche del paziente, non solo competenze in una particolare disciplina medica, abbiamo scoperto che l’abilitazione dell’autoapprendimento ha prodotto guadagni costanti e significativi. Il risultato: un aumento complessivo chiaro e significativo nella qualità dell’accesso per Rerank 4 Fast.”













