Vorresti più informazioni intelligenti nella tua scatola in arrivo? Iscriviti solo alle nostre newsletter settimanali per ottenere la cosa importante per l’intelligenza artificiale aziendale, i dati e i leader della sicurezza. Iscriviti ora


NOS RICERCAÈ stato tranquillamente un tentativo di intelligenza artificiale segreta emersa come una voce di spicco nel movimento dell’IA open source Hermes 4 Lunedì, la famiglia dei modelli di grandi dimensioni rivendicati dalla società può corrispondere alle prestazioni dei principali sistemi registrati offrendo al contempo un controllo degli utenti senza precedenti e restrizioni minime dei contenuti.

Il rilascio rappresenta un importante aumento della guerra tra i difensori dell’IA Open -Source e le principali società tecnologiche che devono controllare l’accesso alle capacità di intelligenza artificiale avanzate. A differenza dei modelli ApertoGoogleO AntropicoHermes 4 è progettato per rispondere a quasi tutte le richieste senza essere standard nei sistemi di intelligenza artificiale commerciali.

“Hermes 4, modelli allineati agli utenti con funzionalità di calcolo del tempo di prova ampliato stanno sviluppando la nostra eredità, Nous Research X (precedentemente chiamato Twitter).” I modelli sono stati un’attenzione speciale per rendere creativa e interessante l’interazione senza censura numerata e le ultime tecnologie per i modelli a pesi aperti sono stati allineati come in modo neutralmente mantenendo la matematica, la codifica e il ragionamento. “

La modalità “ibrida ragionamento” di Hermes 4 funziona meglio di Chatgpt e Claude in criteri matematici

Hermes 4 Introduce ciò che Nous Research chiama “ragionamento ibrido e consente agli utenti di passare da risposte rapide e processi di pensiero più profondi e gradini. Se abilitati, i modelli producono specificamente un ragionamento interno Prima di dare una risposta finale, etichette – simili ai modelli di ragionamento O1 di Openi, ma con piena trasparenza al processo di pensiero di AI.


Ai Stroops sui limiti di ridimensionamento

I limiti di potenza, l’aumento dei costi dei marcatori e le inferenze ritardi rimodellano AI aziendale. Unisciti alla nostra sala privata per scoprire come sono le migliori squadre:

  • Trasformare l’energia in un vantaggio strategico
  • Architetto efficiente deduzione per guadagni di resa reale
  • Aprire lo sblocco di un rendimento degli investimenti competitivi con sistemi AI sostenibili

Assicurati il ​​tuo posto dove stare in futuro: https://bit.ly/4mwgngo


Il successo tecnico è importante. Nel test, il più grande modello di parametri di 405 miliardi di parametri di Hermes 4, Confronto matematico-500 81,9% in modalità di ragionamento e sfide Concorso di matematica Aime’24 – Performance che opprime o supera molti sistemi registrati che costano milioni di più.

L’intelligenza artificiale è un ricercatore, “la difficoltà è quella di rendere utili tracce di pensiero e verificatore senza ragionamento illegale”, ha detto. X su Rohan PaulEnfatizzare una delle scoperte tecniche della versione.

Forse il più importante, Hermes 4 I sistemi AI hanno ottenuto il punteggio più alto tra tutti i modelli testati per una nuova ricerca di nodi di confronto per misurare la frequenza con cui rifiuta le domande di rispondere alle domande. Il modello ha segnato il 57,1%in modalità di ragionamento e GPT-4O (17,67%) e Claude Sonnet 4 (17%) hanno ottenuto risultati significativamente migliori.

Modelli Hermes 4, modelli di NOS Research, Modelli dei frequentemente rifiutati di rispondere alle richieste degli utenti, un test che misura i sistemi di rifiuto, una misura significativa ha risposto a più domande. (Credito: Nous Research)

Inside DataForge e Atropos: i sistemi rivoluzionari dietro le capacità di Hermes 4

Dietro i talenti di Hermes 4, si trova un’infrastruttura educativa sofisticata NOS RICERCA Si è sviluppato per diversi anni. I modelli sono stati addestrati utilizzando due nuovi sistemi: DataForgeProduttore di dati sintetici basati su grafica e AtropsUn frame di apprendimento del rinforzo open source.

DataForge Crea dati educativi attraverso ciò che l’azienda definisce come “passeggiate casuali attraverso grafici diretti e trasforma i semplici dati di pre -educazione in esempi di monitoraggio di insegnamento complessi. Il sistema, ad esempio, può prendere un articolo di Wikipedia e convertirlo in una canzone rap, quindi creare domande e risposte basate su questa trasformazione.

AtropsNel frattempo, i modelli di intelligenza artificiale funzionano come centinaia di ambienti di educazione speciale in cui si applicano alcune competenze (matematica, codifica, uso del veicolo e testo creativo). Questo approccio di “campionamento del rifiuto” consente solo risposte verificate e di alta qualità per convertirlo in dati educativi.

“Nous ha usato questi ambienti per creare un set di dati per Hermes 4!” descritto Tommy Shaughnessyun’iniziativa capitalista Delphi Ventures Ha investito in NOS Research. “Tutti i set di dati contiene 3,5 milioni di campioni di ragionamento e 1,6 milioni di esempi irragionevoli! Hermes non è solo addestrato sui dati RL, non sui set di dati statici della domanda e della risposta!”

Processo educativo 192 Nvidia GPU B200 E per il più grande modello 71.616 GPU – un investimento di calcolo importante ma senza precedenti che mostra come le tecniche specializzate possono competere con la portata dei giganti della tecnologia di grandi dimensioni.

Research Nous Why Ai Safety Ralles ‘può essere brutto come l’inferno’ e crede nella sconfitta dell’innovazione

NOS RICERCA Ha formato la sua reputazione su una filosofia che mette il controllo degli utenti sulle politiche dei contenuti aziendali. I modelli dell’azienda sono progettati per essere “diretti, cioè senza rigide restrizioni di sicurezza che caratterizzano i sistemi di intelligenza artificiale commerciali o possono essere richiesti di comportarsi in certi modi.

“Hermes 4 non è incatenato per essere incatenato a essere un Hermes 4, rinuncia, regole e estremamente caute, il che analizza la versione, che analizza la versione, che fa male fastidiosa, innovazione e usabilità come l’inferno”. “Se tutti rifiuta l’open source, non ha senso. Hermes non è un problema con il 4 °.”

Ha fatto questo approccio NOS RICERCA Popolare tra i ricercatori di AI e gli sviluppatori che desiderano la massima flessibilità, ma colloca l’azienda al centro delle discussioni continue sulla sicurezza e sul controllo dei contenuti. I modelli possono essere utilizzati teoricamente per scopi dannosi, mentre la ricerca NOS sostiene che la trasparenza e il controllo degli utenti sono preferiti per l’aggravamento aziendale.

Azienda Rapporto tecnicoOltre ai modelli, fornisce un dettaglio senza precedenti sul processo di formazione, i risultati della valutazione e persino i test di confronto. “Riteniamo che questo rapporto abbia creato un nuovo standard per la trasparenza in confronto”, ha affermato la società.

In che modo una piccola iniziativa con 192 GPU competono contro i miliardi di dollari di Big Tech di budget di AI

Hermes 4Il rilascio arriva in un momento molto importante nel settore dell’IA. Mentre le principali aziende tecnologiche vengono riversate in miliardi per sviluppare sistemi di intelligenza artificiale sempre più potenti, un movimento in crescita a livello aperto sostiene che queste competenze non dovrebbero essere controllate da una manciata di aziende.

Negli ultimi mesi, ha visto sviluppi significativi nell’intelligenza artificiale aperta con modelli come Meta Lama 3.1DeepSeek’s R1E Qwen di Alibaba Per ottenere le prestazioni delle concorrenti con i sistemi registrati. Hermes 4 rappresenta un altro passo in questo progresso, specialmente nel campo del ragionamento – Openi’s O1.

“Innanzitutto, Nous è un tentativo con dozzine di persone di grande talento”, Nota Shaughnessy. “Un iperscaler o 1.000 dipendenti non hanno una spesa annuale di Capex di 100b+ Capex annuale e continuano a rivelare modelli e ricerche innovative a una velocità folle.”

Inizia, quale Ha raccolto fondi di $ 65 milioni All’inizio di quest’anno leader Paradigmasi sta anche sviluppando Rete spiritualeUn sistema di istruzione distribuito volto a coordinare la formazione di intelligenza artificiale su computer connessi a Internet utilizzando la tecnologia blockchain.

Correzione tecnica che interrompe il pensiero di Hermes 4 nei cicli infiniti

Qualcuno Hermes 4Il più importante contributo tecnico si occupa di un problema che disturba i modelli di ragionamento: processi di pensiero estremamente lungo. I ricercatori hanno trovato modelli di parametri di 14 miliardi di piccoli miliardi, ragionamento che il ragionamento avrebbe raggiunto il 60% delle volte per raggiungere la lunghezza massima del contesto e essenzialmente bloccato in cicli di pensiero infiniti.

Le soluzioni includevano una seconda fase di allenamento che insegnava modelli per fermare il ragionamento in 30.000 monete e mantenne la maggior parte delle prestazioni di ragionamento del 65-79%. Questa tecnica di “controllo della lunghezza” può essere preziosa per una più ampia comunità di ricerca AI.

“I modelli più piccoli (<14b) tendono a pensare troppo quando distillati, ma non ci sono modelli più grandi, AI, ricercatore di intelligenza artificiale Muyu o xEnfasi sulle informazioni dal rapporto tecnico.

Ma, Hermes 4 Si trova ancora di fronte a limiti che sono ancora comuni nei modelli open source. Nonostante le impressionanti prestazioni di confronto, i modelli richiedono una fonti di calcolo significative per essere eseguita e potrebbero non corrispondere alla facilità o all’affidabilità dei servizi di intelligenza artificiale commerciale per molte applicazioni.

Dove provare Hermes 4 e qual è il costo rispetto a Chatgpt e Claude

NOS RICERCA lo ha fatto Hermes 4 È disponibile attraverso più canali che riflettono la filosofia open source. I pesi del modello possono essere scaricati liberamente sul viso, mentre la società offre l’accesso API attraverso partenariati con i rinnovati interfaccia di chat e fornitori di inferenza come scivoli, nebius e luminale.

Enfatizzando caratteristiche come interazioni parallele e un sistema di memoria, ha detto: “Puoi provare Hermes 4 nella nuova e rinnovata interfaccia utente di chat NOS”.

Per gli utenti e i ricercatori aziendali, i modelli rappresentano un’alternativa potenzialmente interessante per pagare i sistemi registrati, in particolare per le applicazioni che richiedono alti livelli di privatizzazione o elaborazione di contenuti sensibili.

Immagine generale: Hermes 4, cosa significa per il futuro dello sviluppo dell’IA

Pubblicazione Hermes 4 Rappresenta più di un altro lancio di modelli di intelligenza artificiale: un’espressione su chi dovrebbe controllare il futuro dell’intelligenza artificiale. In un settore in cui una manciata di gigante della tecnologia con risorse quasi illimitate è sempre più dominante, Nous Research ha dimostrato che l’innovazione può ancora provenire da luoghi inaspettati.

L’approccio dell’azienda rivela le domande di base sui cambiamenti tra sicurezza e capacità tra controllo aziendale e libertà dell’utente. Le grandi società tecnologiche sostengono che sono necessarie attente ringhiere di controllo dei contenuti e di sicurezza per la distribuzione dell’intelligenza artificiale responsabile, mentre la ricerca NOS suggerisce che la trasparenza e l’agenzia degli utenti sono più importanti delle restrizioni istituzionali.

Si vede se questa filosofia alla fine dimostrerà che non sarà utile o problematico. Ma qualcosa è certo: Hermes 4 ha mostrato che il futuro di AI non sarà determinato da aziende con tasche più profonde.

In un’area in cui le impossibilità di ieri sono diventate merci, Nous Research ha dimostrato che l’unica cosa che è più pericolosa di un’intelligenza artificiale che ha detto che no potrebbe essere qualcuno che vuole dire di sì.


Collegamento alla fonte