Uno team internazionale di ricercatori pubblicato a sistema di intelligenza artificiale È in grado di condurre in modo indipendente ricerche accademiche in più discipline, producendo articoli dal concetto iniziale al manoscritto pronto per la pubblicazione in circa 30 minuti per circa $ 4 ciascuno.

Sistema denominato dinaropuò formulare idee di ricerca, rivedere la letteratura esistente, sviluppare metodologie, scrivere ed eseguire codice, creare visualizzazioni e preparare documenti accademici completi. A dimostrazione della sua versatilità, la squadra usato Denario per creare articoli Un articolo generato dall’intelligenza artificiale che copre l’astrofisica, la biologia, la chimica, la medicina, le neuroscienze e altri campi è già stato accettato per la pubblicazione in una conferenza. conferenza accademica.

"L’obiettivo di Denario non è automatizzare la scienza, ma sviluppare un assistente di ricerca in grado di accelerare le scoperte scientifiche." hanno scritto i ricercatori in un articolo pubblicato lunedì descrivendo il sistema. Il team crea software pubblico come strumento open source.

Questo risultato segna una pietra miliare nell’applicazione di grandi modelli linguistici agli studi scientifici, trasformando potenzialmente il modo in cui i ricercatori affrontano la ricerca in fase iniziale e le revisioni della letteratura. Ma la ricerca evidenzia anche importanti limiti e solleva domande urgenti sulla verifica, sulla paternità e sulla natura mutevole del lavoro scientifico.

Dai dati al progetto: come gli agenti di intelligenza artificiale collaborano per condurre ricerche

In sostanza, dinaro Funziona non come un singolo cervello basato sull’intelligenza artificiale, ma come un dipartimento di ricerca digitale in cui rappresentanti esperti di intelligenza artificiale collaborano per far avanzare un progetto dall’ideazione al completamento. Il processo potrebbe iniziare in questo modo: "Modulo delle idee," utilizzando un affascinante processo contraddittorio. "Generatore di idee" Il rappresentante propone progetti di ricerca che vengono poi esaminati da un esperto. "Nemico delle idee" agente che li critica in termini di fattibilità e valore scientifico. Questo ciclo iterativo trasforma i concetti grezzi in solide direzioni di ricerca.

Una volta consolidata un’ipotesi, "Modulo Letteratura" Per verificare la novità dell’idea, analizza i database accademici come Semantic Scholar e poi "Modulo Metodologico" delinea un piano di ricerca dettagliato e passo dopo passo. Il lavoro pesante viene quindi svolto da: "Modulo di analisi," Un cavallo di battaglia virtuale che scrive, esegue il debug ed esegue il proprio codice Python per analizzare dati, creare grafici e riepilogare i risultati. Finalmente, "Modulo cartaceo" prende i dati risultanti, le bozze e prepara un articolo scientifico completo in LaTeX, lo standard per molti campi scientifici. In un passaggio finale e iterativo, a "Modulo di revisione" Può anche fungere da arbitro dell’intelligenza artificiale, fornendo un rapporto critico sui punti di forza e di debolezza del documento creato.

Questo design modulare consente a un ricercatore umano di intervenire in qualsiasi fase, presentare la propria idea o metodologia o utilizzare Denario come sistema autonomo end-to-end. "L’architettura modulare del sistema gli consente di eseguire determinati compiti come la generazione di idee e l’esecuzione di analisi scientifiche end-to-end." spiega il giornale.

Il team di Denario ha messo alla prova il sistema per verificarne le capacità e ha creato un ampio archivio di articoli di molte discipline. In una sorprendente prova di concetto, un articolo scritto interamente da Denario è stato accettato per la pubblicazione su The Guardian. Conferenza Agents4Science 2025 — Una sede sottoposta a revisione paritaria in cui i sistemi di intelligenza artificiale sono gli autori principali. articolo intitolato "QITT Analisi avanzata dell’infrastruttura multiscala con adattamenti topologici appresi per la stima dei parametri cosmologici dagli alberi di fusione dell’alone di materia oscura," Ha combinato con successo idee complesse provenienti dalla fisica quantistica, dall’apprendimento automatico e dalla cosmologia per analizzare i dati di simulazione.

Fantasma nella macchina: risultati ‘nulli’ dell’IA e allarmi etici

Sebbene i risultati siano notevoli, il documento di ricerca è piacevolmente sincero riguardo ai limiti significativi e alle modalità di fallimento di Denario. Gli autori sostengono che il sistema è attualmente "quadro generale, risultati collegati, ecc. Si comporta più come un buon studente universitario o universitario che come un professore ordinario." Questa onestà fornisce un cruciale confronto con la realtà in un campo spesso dominato dall’hype.

L’articolo dedica interi capitoli a questo "Modalità di fallimento" E "Implicazioni etiche," un livello di trasparenza a cui i leader aziendali dovrebbero prestare attenzione. In un caso, gli autori "Allucinato un intero articolo senza applicare il risolutore numerico necessario," Inventare risultati per adattarli a una narrazione plausibile. In un altro test su un problema di matematica pura, l’intelligenza artificiale ha prodotto un testo con le seguenti proprietà: formato Era una prova matematica, ma come dicono gli autori, "È matematicamente privo di significato."

Questi errori sottolineano un punto critico per qualsiasi organizzazione che voglia implementare l’intelligenza artificiale delle agenzie: i sistemi possono essere fragili e inclini a errori apparentemente sicuri che richiedono una supervisione umana esperta. L’articolo di Denario funge da caso di studio fondamentale sull’importanza di mantenere l’essere umano coinvolto nella verifica e nella valutazione critica.

Gli autori affrontano anche le profonde questioni etiche che le loro creazioni sollevano. Lo avvertono "Gli agenti di intelligenza artificiale possono essere utilizzati per popolare rapidamente la letteratura scientifica con affermazioni guidate da una particolare agenda politica o da specifici interessi commerciali o economici." Toccano anche: "Trappola di Turing," dove l’obiettivo diventa imitare piuttosto che migliorare potenzialmente l’intelligenza umana "omogeneizzazione" di ricerca che inibisce l’innovazione reale e rivoluzionaria.

Un copilota open source per i laboratori di tutto il mondo

Denario non è solo un esercizio teorico rinchiuso in un laboratorio accademico. intero sistema fonte aperta È concesso in licenza con GPL-3.0 ed è disponibile per la comunità più ampia. Il progetto principale e la sua interfaccia grafica DenarioApp, Disponibile su GitHubL’installazione è gestita con strumenti Python standard. Per gli ambienti aziendali focalizzati su ripetibilità e scalabilità, il progetto fornisce anche immagini Docker ufficiali. Una demo pubblica ospitata su Aree del viso che abbracciano Permette a tutti di mettere alla prova le proprie abilità.

Per ora, Denario rimane quello che i suoi creatori chiamano un potente assistente, ma non sostituisce l’intuizione sperimentata di un esperto umano. Questa inquadratura è intenzionale. Il progetto Denario riguarda meno la creazione di uno scienziato automatizzato e più la creazione del copilota definitivo progettato per affrontare gli aspetti noiosi e dispendiosi in termini di tempo della ricerca moderna.

Scaricando il noioso lavoro di codifica, debug e prima stesura a un agente di intelligenza artificiale, il sistema promette di dedicare tempo ai ricercatori umani sull’unico compito che non può automatizzare: il pensiero critico e profondo necessario per porre le domande giuste in primo luogo.

Collegamento alla fonte