Home Tecnologia Dai guardrail alla governance: una guida del CEO per proteggere i sistemi...

Tecnologia

Dai guardrail alla governance: una guida del CEO per proteggere i sistemi di agenti

4 Febbraio 2026

3. Autorizzazioni in base alla progettazione: legare gli strumenti alle attività, non ai modelli

Un anti-modello comune è quello di dare al modello una credibilità duratura e, si spera, mantenerlo umile. SAIF e NIST sostengono il contrario: credenziali e ambiti dovrebbero essere legati a strumenti e compiti, ruotati regolarmente e verificabili. Gli agenti richiedono quindi funzionalità ad ambito ristretto attraverso tali dispositivi.

In pratica, funziona così: “L’agente finanziario può leggere, ma non scrivere, alcuni registri senza l’approvazione del CFO”.

La domanda dell’amministratore delegato: Possiamo revocare un’abilità specifica a un agente senza riprogettare l’intero sistema?

Controllare dati e comportamenti

Queste fasi vincolano l’input, l’output e il comportamento del gate.

4. Input, Memoria e RAG: Trattare il materiale esterno come ostile fino a prova contraria

La maggior parte degli incidenti degli agenti iniziano con dati segreti: una pagina Web, un PDF, un’e-mail o un archivio avvelenato che introduce di nascosto istruzioni dell’avversario nel sistema. Il cheat sheet di pronta iniezione di OWASP e la guida stessa di OpenAI insistono entrambi sulla separazione rigorosa delle istruzioni di sistema dal contenuto dell’utente e sul trattamento delle fonti di ripristino non controllate come non attendibili.

Operativamente, prima che qualsiasi cosa entri nel recupero o nella memoria a lungo termine, gate: le nuove fonti vengono riviste, etichettate e integrate; La memoria persistente è disabilitata quando esistono riferimenti non attendibili; Ad ogni pezzo è associata una provenienza.

La domanda dell’amministratore delegato: Possiamo contare tutte le fonti di contenuto esterne da cui i nostri agenti apprendono e chi le ha approvate?

5. Gestione dell’output e rendering: nulla viene eseguito “solo perché il modello lo dice”

Nel caso Anthropic, il codice exploit generato dall’intelligenza artificiale e i dump delle credenziali sono confluiti direttamente nell’azione. Qualsiasi output che potrebbe causare effetti collaterali richiede un validatore tra l’agente e il mondo reale. La categoria Gestione non sicura dell’output di OWASP è ovvia a questo punto, così come lo sono le migliori pratiche di sicurezza del browser relative alle limitazioni di base.

Collegamento alla fonte

Facebook
Twitter
Pinterest
WhatsApp

Previous article“Il capitalismo è sempre stato il vero cattivo”: i fan di Outer Worlds 2 reagiscono al compenso per la speranza del sequel, afferma che il prezzo iniziale di $ 80 di Microsoft ha ucciso l’hype
Next article2XKO è più complesso di quanto sembri

Spartaco Pascucci

RELATED ARTICLES MORE FROM AUTHOR

Il passo mancante tra promozione e profitto

Samsung Galaxy Z Fold 8 vs Z Fold 8 Wide: specifiche a confronto

Insta360 Luna Ultra vs DJI Pocket 4: confronto completo

Ultimo post

Trump Turnberry è morto in 28 Open

27 Aprile 2026

I prezzi dell’argento scendono mentre i mercati tengono d’occhio la riunione...

27 Aprile 2026

Agente NICE: Donald Trump sostiene la ridenominazione della chiave agenzia governativa

27 Aprile 2026

I futures del Dow Jones scivolano mentre le tensioni in Iran...

27 Aprile 2026

Il produttore del gateway alla fine ha riconosciuto il problema, omettendo...

27 Aprile 2026

Le vendite di Resident Evil Requiem spingono Capcom ad aumentare le...

27 Aprile 2026

Solheim Cup – Colonna del Capitano di Anna Nordqvist: abiti per...

27 Aprile 2026

Il passo mancante tra promozione e profitto

27 Aprile 2026

Il cambio USD/JPY si indebolisce mentre lo yen si rafforza in...

27 Aprile 2026

Levitt ha informato i giornalisti dopo la cena di caccia

27 Aprile 2026

Il cambio USD/CAD scende ai minimi di sei settimane mentre il...

27 Aprile 2026

Allarme di emergenza dopo che Kansas City ha visto un mese...

27 Aprile 2026

Categoria
Notizia24319
Sport22938
Politica20275
Cultura e spettacolo17285
Finanza11139
Tecnologia7391
Attualità4205