Risultati: Invece di accedere alla sezione “Demo gratuita”, Atlas Agent inizia cercando “Demo”. Dopo aver finalmente trovato il filtro macOS, ha perso minuti alla ricerca di un filtro “avere demo”, anche se la ricerca della parola “demo” aveva già ristretto il campo.



Questa pagina dei risultati di ricerca riguarda ciò che Atlas Agent è riuscito a ottenere quando gli ho chiesto una demo del gioco.

Credito: Kyle Orland

Questa pagina dei risultati di ricerca riguarda ciò che Atlas Agent è riuscito a ottenere quando gli ho chiesto una demo del gioco.


Credito: Kyle Orland

Dopo molto tempo, l’agente ha finalmente fatto clic sul risultato principale della pagina, cosa che è accaduta Romanzo visivo Progetto II: Valle silenziosa. Ma sebbene su quella pagina fosse presente un collegamento “Scarica demo” in primo piano, l’agente si è preoccupato che si trovasse sulla pagina Steam per il gioco completo e non per una demo. Esegui il backup nella pagina dei risultati di ricerca e riprova.

Dopo aver osservato alcune variazioni di questo ciclo per circa dieci minuti, ho interrotto l’agente.

Voto: 1/10. Tecnicamente ha trovato alcune demo di giochi macOS ma ha fallito completamente durante il tentativo di scaricarle.

risultato finale

Attraverso sei diverse attività basate sul web (ho escluso il vandalismo Wiki dal mio riepilogo), Atlas Agent ha ottenuto 7,5 punti (e una media di 6,83 punti) sulla mia scala di 10 punti piuttosto soggettiva. Questo è in realtà migliore di quanto mi aspettassi per una funzionalità di “modalità anteprima” che apparentemente è ancora ampiamente testata da OpenAI.

Nei miei test, l’Atlante è stato generalmente in grado di interpretare accuratamente ciò che gli veniva chiesto e di navigare ed elaborare attentamente (anche se lentamente) le informazioni sulle pagine web. L’agente è stato in grado di navigare in semplici menu basati sul Web e di aggirare ostacoli imprevisti con relativa facilità per la maggior parte del tempo, anche se altre volte è rimasto intrappolato in un ciclo infinito.

Il principale fattore limitante in molti dei miei test è la “limitazione tecnica della durata della sessione” che sembra limitare la maggior parte delle attività a pochi minuti. Considerato il tempo impiegato dall’agente Atlas per capire dove fare clic successivamente e la natura ripetitiva dei tipi di attività che desidero che un agente web automatizzi, ciò limita fortemente la sua utilità. Una versione di Atlas Agent che potesse essere eseguita indefinitamente in background avrebbe ottenuto qualche punto in più nei miei parametri.

Tutto sommato, la “modalità agente” di Atlas non è ancora abbastanza affidabile per essere utilizzata come strumento di automazione in background “imposta e dimentica”. Ma per compiti semplici e ripetitivi che un essere umano può controllare in seguito, sembra già qualcosa che posso usare per evitare parte della fatica della mia vita online.

Collegamento alla fonte