Il momento di successo di DeepSeek non è stato il primo successo open source della Cina. Quan Lab di Alibaba rilascia modelli a peso aperto da anni. Nel settembre 2024, ben prima del lancio della v3 di DeepSeek, Alibaba affermava che i download globali avevano superato i 600 milioni. Su Hugging Face, Quen ha rappresentato oltre il 30% di tutti i modelli scaricati nel 2024. Anche altre istituzioni, tra cui l’Accademia di Intelligenza Artificiale di Pechino e la società di intelligenza artificiale Beichuan, stavano rilasciando modelli aperti già nel 2023.

Ma dopo il successo di DeepSeek, questo campo si è espanso rapidamente. Aziende come Z.ai (ex Zhipu), MiniMax, Tencent e un numero crescente di piccoli laboratori hanno rilasciato modelli che competono su ragionamento, codifica e attività in stile agente. Il numero crescente di modelli capaci ha accelerato il progresso. Funzionalità che prima impiegavano mesi per arrivare nel mondo open source ora compaiono nel giro di settimane, addirittura giorni.

“Le aziende cinesi di intelligenza artificiale hanno riscontrato vantaggi reali dai playbook open source”, afferma Liu Zhiyuan, professore di informatica alla Tsinghua University e capo scienziato della startup AI ModelBest. “Rilasciando ricerche approfondite, costruiscono reputazione e ottengono pubblicità gratuita”.

Al di là degli incentivi commerciali, l’open source ha assunto un’importanza culturale e strategica, afferma Liu. “Nella comunità dei programmatori cinesi, l’open source è diventato politicamente corretto”, afferma, inquadrandolo come una reazione al dominio americano nei sistemi di intelligenza artificiale proprietari.

Questo cambiamento si riflette anche a livello istituzionale. Le università, tra cui Tsinghua, hanno iniziato a incoraggiare lo sviluppo dell’intelligenza artificiale e i contributi open source, mentre i politici si sono mossi per formalizzare tali incentivi. Ad agosto, il Consiglio di Stato cinese ha pubblicato una bozza di politica che incoraggia le università a premiare il lavoro open source, proponendo che i contributi degli studenti su piattaforme come GitHub o Gitee possano eventualmente contare ai fini del credito accademico.

Con uno slancio crescente e forti cicli di feedback, è probabile che la spinta della Cina per un modello open source continui nel breve termine, sebbene la sua sostenibilità a lungo termine dipenda ancora dai risultati finanziari, afferma Tiezhen Wang, che aiuta a guidare il lavoro sull’intelligenza artificiale globale presso Hugging Face. A gennaio i laboratori modello Z.ai e MiniMax si sono quotati in borsa a Hong Kong. “In questo momento, l’obiettivo è rendere la torta più grande”, afferma Wang. “La prossima sfida è capire come ciascuna azienda si assicura la propria quota”.

La prossima ondata di modelli sarà più ristretta e migliore

I modelli open source cinesi sono leader non solo nel volume di download ma anche nella diversità. Quen di Alibaba è diventata una delle famiglie di modelli aperti più diversificate in circolazione, offrendo un’ampia gamma di varianti adatte a diversi usi. La gamma spazia da modelli leggeri che possono essere eseguiti su un singolo laptop, a sistemi di grandi dimensioni con centinaia di miliardi di parametri progettati per implementazioni di data center. Quen ha diverse varianti ottimizzate per le attività create dalla comunità: i modelli “Istruzioni” sono bravi a seguire i comandi e le varianti “Codice” sono specializzate nella codifica.

Sebbene questa strategia non sia esclusiva dei laboratori cinesi, Quen è stata la prima famiglia di modelli aperti a offrire così tante opzioni di alta qualità da iniziare a sembrare una linea di prodotti completa, tutti gratuiti.

Collegamento alla fonte