Per portare i numeri generali, il team che ha analizzato l’analisi delle richieste e dell’hardware che sono serviti per il loro periodo di 24 ore, nonché tempo pigro per quell’hardware. Dà una forza secondo la loro richiesta, che è diversa sulla base del modello utilizzato. Per ogni giorno, identificano il prompt mediano e lo usano per calcolare gli effetti ambientali.
Scendendo
Usando questi presupposti vedono che l’effetto di una richiesta di testo separata è molto piccolo. “Partiamo dal presupposto che il testo MEDIAN GENNY APPS richiedesse il prompt del testo, usando 0,03 grammi di biossido di carbonio equivalente (GCO 2E) e accettano 0,26 millilitri (o circa cinque gocce) d’acqua”, arrivano alla conclusione. In questo contesto, presumono che l’uso dell’energia sia di circa nove secondi a guardare la TV.
La cattiva notizia è il volume delle richieste senza dubbio molto alte. La società ha scelto di implementare un’operazione di intelligenza artificiale con la richiesta di ogni singola richiesta, chiedendo un calcolo che non esisteva pochi anni fa. Pertanto, anche se l’effetto distintivo è piccolo, il costo crescente può essere sufficiente.
Buone notizie? Solo un anno fa, sarebbe stato peggio.
Alcune delle situazioni sono in calo. Con l’ascesa dell’energia solare negli Stati Uniti e altrove, è stato più facile per Google fornire energia rinnovabile. Di conseguenza, le emissioni di carbonio per unità di energia sofferente sono diminuite di 1,4x nell’ultimo anno. Tuttavia, la più grande vittoria è sul lato software, in cui diversi metodi riducono l’energia per prompt 33x.
La maggior parte del consumo di energia nel servizio delle richieste di intelligenza artificiale proviene dal tempo trascorso per chip di acceleratore personalizzato.
Credito: Elsworth, ecc. Al
L’agenzia del team di Google descrive molte ottimizzazioni che lo contribuiscono. Un approccio è un esperto di miscela, in cui la parte di un modello di intelligenza artificiale richiesto per gestire richieste specifiche è coinvolta nella determinazione di come attivare, che può lanciare calcoli di un fattore da 10 a 100, hanno creato diverse versioni compatte del loro modello originale, che riduce anche il carico dei calcoli. La gestione dei data center svolge anche un ruolo, poiché la società può confermare che qualsiasi hardware attivo è stato completamente utilizzato, quando il resto ha permesso di rimanere nello stato di breve potenza.