Nonostante i crescenti discorsi su un futuro in cui la maggior parte dei lavori umani saranno automatizzati dall’intelligenza artificiale, una delle ironie dell’attuale boom tecnologico è la testardaggine con cui rimane umana, in particolare il processo di addestramento dei modelli di intelligenza artificiale utilizzando l’apprendimento per rinforzo (RLHF) dal feedback umano.
Nella sua forma più semplice, RLHF è un sistema di addestramento: dopo che un’intelligenza artificiale è stata addestrata su dati selezionati, continua a commettere errori o sembra un robot. Gli appaltatori umani vengono quindi reclutati in massa dai laboratori di intelligenza artificiale per valutare e classificare i risultati di un nuovo modello durante la formazione, e il modello apprende dalle loro valutazioni e adatta il suo comportamento per fornire risultati di livello più alto. Questo processo diventa ancora più importante man mano che l’intelligenza artificiale si espande per produrre output multimediali con misure di qualità più sfumate e soggettive, come video, audio e immagini.
Storicamente, questo processo di formazione è stato un grosso grattacapo logistico e un incubo nelle pubbliche relazioni per le aziende di intelligenza artificiale che fanno affidamento su reti frammentate di appaltatori stranieri e pool di tagging statici in specifici hub geografici a basso reddito. Descritto dai media come un salario basso – anche di sfruttamento. È anche inefficiente: richiede ai laboratori di intelligenza artificiale di attendere settimane o mesi per un singolo set di feedback, ritardando il progresso del modello.
Ora è emersa una nuova iniziativa che renderà il processo molto più efficiente: Momentopiattaforma in modo efficace "gamifica" RLHF invia tali attività di revisione a circa 20 milioni di utenti di app popolari in tutto il mondo, tra cui Duolingo o Candy Crush, sotto forma di brevi attività di revisione su richiesta che possono scegliere di completare invece di guardare annunci mobili, e invia immediatamente i dati a un laboratorio di intelligenza artificiale distribuito.
Come condiviso con VentureBeat in un comunicato stampa, la piattaforma consente ai laboratori di intelligenza artificiale di farlo "iterare i modelli quasi in tempo reale," Riduce notevolmente i tempi di sviluppo rispetto ai metodi tradizionali.
Il CEO e fondatore Jason Corkill ha dichiarato nella stessa dichiarazione di Rapidata: "Il ragionamento umano è disponibile su scala globale e quasi in tempo reale, aprendo le porte a un futuro in cui i team di intelligenza artificiale possono eseguire cicli di feedback continui e costruire sistemi che migliorano ogni giorno anziché ogni ciclo di rilascio.""
Rapidata tratta RLHF come un’infrastruttura ad alta velocità piuttosto che come un problema di lavoro manuale. Oggi, la società ci ha annunciato in esclusiva a VentureBeat di essere emersa con un round di avviamento da 8,5 milioni di dollari co-guidato da Canaan Partners e IA Ventures, con la partecipazione di Acequia Capital e BlueYard, per ampliare il suo approccio unico ai dati umani on-demand.
Conversazione al bar che crea una nuvola umana
Rapidata non nasce in una sala riunioni, ma a un tavolo con qualche birra. Mentre studiava robotica e visione artificiale all’ETH di Zurigo, Corkill si è scontrato con il muro che ogni ingegnere di intelligenza artificiale prima o poi deve affrontare: il collo di bottiglia nella descrizione dei dati.
"Nello specifico, lavoro da diversi anni nel campo della robotica, dell’intelligenza artificiale e della visione artificiale, ho studiato all’ETH di Zurigo e sono sempre rimasto deluso dalle descrizioni dei dati." Corkill lo ha ricordato in una recente intervista. "Ogni volta che avevi bisogno di persone o di annotazioni di dati umani, il tuo progetto era in una sorta di stallo perché fino ad allora potevi portarlo avanti solo spingendolo più a lungo di notte. Ma quando avevi bisogno di una divulgazione umana su larga scala, dovevi andare da qualcuno e aspettare qualche settimana.".
Frustrati da questo ritardo, Corkill e i suoi cofondatori si resero conto che l’attuale modello di lavoro per l’intelligenza artificiale era fondamentalmente rotto per un mondo che si muove alle moderne velocità di calcolo. Mentre l’informatica cresce in modo esponenziale, la tradizionale forza lavoro umana, vincolata da assunzioni manuali, assunzioni regionali e cicli retributivi lenti, non lo fa. Rapidata è nata dall’idea che il giudizio umano potesse essere fornito come un servizio distribuito a livello globale, quasi istantaneo.
Tecnologia: trasformare le impronte digitali in dati di addestramento
La principale innovazione di Rapidata risiede nel metodo di distribuzione. Invece di assumere revisori a tempo pieno in regioni specifiche, Rapidata sta sfruttando l’economia dell’attenzione esistente nel mondo delle app mobili. Collaborando con app di terze parti come Candy Crush o Duolingo, Rapidata offre agli utenti una scelta: guardare un annuncio tradizionale o dedicare qualche secondo a fornire feedback per un modello di intelligenza artificiale.
"Agli utenti viene posta la domanda: “Ehi, preferiresti annotare alcuni dati e fornire feedback invece di guardare annunci pubblicitari e avere aziende che ti comprano gli occhi in quel modo?”" Corkill ha spiegato. Secondo Corkill, dal 50% al 60% degli utenti preferisce un’attività di feedback rispetto a un annuncio video tradizionale.
Questo "intelligenza della folla" L’approccio consente ai team di intelligenza artificiale di attingere a una fascia demografica globale diversificata su una scala senza precedenti.
-
Rete globale: Rapidata raggiunge attualmente dai 15 ai 20 milioni di persone.
-
Parallelismo principale: La piattaforma può elaborare 1,5 milioni di commenti umani in una sola ora.
-
Velocità: I cicli di feedback che in precedenza richiedevano settimane o mesi sono stati ridotti a ore o addirittura minuti.
-
Controllo qualità: La piattaforma crea nel tempo profili di fiducia e competenza per i partecipanti, garantendo che le domande complesse vengano abbinate ai giudici umani più rilevanti.
-
Anonimato: Mentre gli utenti vengono tracciati tramite identità anonime per garantire coerenza e affidabilità, Rapidata non raccoglie identità personali e protegge la privacy ottimizzando la qualità dei dati.
RLHF online: passaggio alla GPU
Il salto tecnologico più significativo reso possibile da Rapidata è quello che Corkill descrive come: "in linea RLHF". Tradizionalmente, l’intelligenza artificiale viene addestrata in lotti disconnessi: si addestra il modello, ci si ferma, si inviano i dati alle persone, si aspettano settimane per le etichette e poi si va avanti. Questo crea un "appartamento" informazioni che spesso mancano di nuovi input umani.
Rapidata porta questa decisione direttamente nel ciclo di formazione. Poiché le loro reti sono così veloci, possono integrarsi direttamente con le GPU che eseguono il modello tramite API.
"Abbiamo sempre avuto l’idea dell’apprendimento per rinforzo per il feedback umano… fino ad ora abbiamo sempre dovuto farlo in gruppi," Ha detto Corkill. "Ora, se andiamo fino in fondo, abbiamo un paio di clienti dove, poiché siamo così veloci, possiamo essere diretti, fondamentalmente nel processo, proprio come il processore a destra della GPU, e la GPU sta calcolando un po’ di output e può richiedercelo al volo in modo distribuito. “Oh, ne ho bisogno, ho bisogno che un essere umano si prenda cura di questo.” Prendo la risposta e applico quella perdita che fino ad ora non era possibile".
Attualmente, la piattaforma supporta circa 5.500 persone al minuto, fornendo feedback in tempo reale ai modelli in esecuzione su migliaia di GPU. Questo impedisce "hacking di modelli di taglie," Qui, due modelli di intelligenza artificiale si ingannano a vicenda in un ciclo di feedback, basando l’addestramento sulle reali sfumature umane.
Prodotto: Soluzione per il piacere e il contesto globale
Man mano che l’intelligenza artificiale va oltre il semplice riconoscimento degli oggetti verso i media generativi, i requisiti di etichettatura dei dati si sono evoluti dall’etichettatura oggettiva all’etichettatura soggettiva. "basato sul gusto" cura. Non si tratta più solo di quello "è questo un gatto?" ma piuttosto "Questa sintesi sonora è convincente?" O "Quale di questi due riassunti sembra più professionale?".
Lily Clifford, CEO della startup di intelligenza artificiale vocale Rime, afferma che Rapidata è stata trasformativa per testare modelli in contesti del mondo reale. "In precedenza, raccogliere feedback significativi significava aggregare fornitori e sondaggi segmento per segmento o paese per paese, cosa che non era scalabile." disse Clifford. Utilizzando Rapidata, Rime può raggiungere il pubblico giusto in Svezia, Serbia o negli Stati Uniti e vedere come si comportano i modelli nei flussi di lavoro dei clienti reali in pochi giorni, non in mesi.
"La maggior parte dei modelli sono effettivamente accurati, ma sono sicuro che hai ricevuto email che pensavi non fossero autentiche, giusto?" osservò Corkill. "Puoi sentire l’odore di un’e-mail AI, puoi sentire l’odore di un’immagine o di un video AI, lo sai subito… questi modelli ancora non sembrano umani e hai bisogno di feedback umano per farlo".
Cambiamento economico e operativo
Dal punto di vista operativo, Rapidata si posiziona come un livello infrastrutturale che elimina la necessità per le aziende di gestire le proprie operazioni di divulgazione proprietarie. Fornendo una rete scalabile, l’azienda abbassa la barriera all’ingresso per i team di intelligenza artificiale che in precedenza avevano difficoltà con i costi e la complessità dei tradizionali cicli di feedback.
Jared Newman di Canaan Partners, che ha guidato l’investimento, suggerisce che questa infrastruttura è necessaria per la prossima generazione di intelligenza artificiale. "Ogni implementazione seria dell’IA dipende dal processo decisionale umano in qualche punto del suo ciclo di vita." Newman ha detto. "Man mano che i modelli passano da compiti basati sulle competenze all’ottimizzazione basata sui gusti, la richiesta di feedback umano scalabile aumenterà in modo significativo".
Il futuro dell’uso umano
Mentre il suo focus attuale è sui laboratori modello nella Bay Area, Corkill vede un futuro in cui i modelli di intelligenza artificiale diventeranno i principali clienti del giudizio umano. dice questo "uso umano".
In questa visione, l’intelligenza artificiale di un progettista di automobili non produrrà solo un veicolo generico; Può chiamare Rapidata in modo programmatico per chiedere a 25.000 persone nel mercato francese cosa pensano di un’estetica particolare, ripetere quel feedback e migliorare il suo design in poche ore.
"La società è in costante cambiamento," Corkill ha osservato che si riferiva alla tendenza a utilizzare l’intelligenza artificiale per simulare il comportamento umano. "Se simulano una società adesso, la simulazione sarà stabile per qualche mese e forse rifletterà la nostra, ma poi cambierà completamente perché la società è cambiata e si è sviluppata in un modo completamente diverso.".
Rapidata si posiziona come interconnettore vitale tra il silicio e la società creando un modo distribuito e programmatico per accedere alla capacità del cervello umano in tutto il mondo. Con 8,5 milioni di dollari di nuovi finanziamenti, la società prevede di agire in modo aggressivo per garantire che l’elemento umano non sia più un collo di bottiglia ma una funzionalità in tempo reale man mano che l’intelligenza artificiale cresce.















