
DeepSeek AI ha lanciato DeepSeek-V3, un nuovo modello linguistico che rappresenta un importante passo avanti nel settore. Basato su un'architettura Mixture-of-Experts, il modello conta 671 miliardi di parametri, con 37 miliardi attivi durante l'inferenza. Addestrato su 14,8 trilioni di token, DeepSeek-V3 offre prestazioni notevoli, superando numerosi concorrenti nei benchmark di comprensione linguistica e ragionamento complesso. La sua efficienza è sorprendente: è stato sviluppato con un budget di addestramento di 6 milioni di dollari utilizzando solo 2048 GPU per due mesi, un risultato che sfida le convenzioni attuali sulla necessità di cluster GPU enormi. La nuova struttura tariffaria dell'API verrà implementata dall'8 febbraio, mantenendo prezzi competitivi.

[Drammatizzazione ispirata alla notizia]
Avete presente quella orribile sensazione quando vi dicono che non siete bravi abbastanza? Che non ce la farete mai? Benvenuti nella mia vita da sviluppatore cinese. Perché mentre in Occidente si crogiolano con i loro ChatGPT e le loro sanzioni tecnologiche, noi qui a Pechino ci siamo rimboccati le maniche e abbiamo fatto l’impossibile. Lo sapete cosa significa lavorare con semiconduttori meno sofisticati? Significa arrangiarsi con quello che hai, come cucinare una cena gourmet con due uova e un sacchetto di riso.
Eppure eccoci qua. DeepSeek-3. Sei milioni di dollari per l’addestramento e un sogno di rivincita. Quando gli americani hanno sentito il numero, probabilmente hanno riso. Ma sapete cosa? La risata è il preludio della paura, e DeepSeek-3 è la prova che la Cina non sta solo rincorrendo. Sta costruendo una strada tutta sua, con meno soldi, meno risorse e molta più determinazione.
Due mesi. 2048 GPU. Il codice era un campo di battaglia. Ogni riga di programmazione era una sfida, ogni bug una sconfitta personale. Ma sapete cosa ci ha tenuto in piedi? L’idea che non stavamo solo scrivendo codice. Stavamo rispondendo. Stavamo dicendo al mondo: Non ci serve la vostra tecnologia di lusso. Non ci serve il vostro permesso. Noi ce la facciamo da soli. Ogni giorno ci svegliavamo con quella frase in mente, ogni notte andavamo a dormire sapendo che avevamo spostato il confine un po’ più in là.
E non è solo il codice. È la geopolitica. È sapere che ogni benchmark che superi, ogni parametro che ottimizzi, è un messaggio. 88.5 su MMLU? 91.6 sul DROP? 90.2 sulla matematica avanzata? Non sono solo numeri. Sono la nostra risposta a chi ci ha messo in lista nera, a chi ha detto che senza di loro non siamo niente.
E poi c’è l’open source. Ah, questa è la parte che mi fa più ridere. Abbiamo pubblicato tutto. Gratis. Ecco il codice, abbiamo detto. Prendetevelo. È una mossa che non avrebbero mai fatto loro. Perché? Perché non capiscono cosa significhi collaborare davvero. Perché per loro è tutto business, soldi, profitto. Ma per noi è orgoglio. È dire: Non solo possiamo farlo, ma possiamo farlo meglio, e possiamo condividerlo con il mondo.
Naturalmente non mancano i critici. Ma il vostro modello non è così raffinato, dicono. Certo, non abbiamo speso centinaia di milioni, anzi miliardi, per lucidarlo. Ma funziona, ed è dannatamente efficiente. Consumiamo meno energia, usiamo hardware meno potente, eppure siamo qui, testa a testa con i giganti. È come vedere Davide che prende a sassate Golia, ma con un budget ridicolo e una montagna di ore di sonno arretrate.
Certo, tutto questo non è solo una questione di tecnologia. È una guerra. No, non quella con missili e soldati, ma una guerra di idee, di approcci, di chi avrà il controllo sul futuro. Non è un caso che gli americani ci abbiano sanzionato. Sanno che qui in Cina non ci limitiamo a copiare. Innoviamo. Miglioriamo. Reinventiamo. E questa è la cosa che li spaventa di più.
Quindi, quando guardate DeepSeek-3, non vedete solo un modello linguistico. Vedete il prodotto di anni di sfide, sacrifici e una determinazione che non si può comprare. È la dimostrazione che, anche con le mani legate dietro la schiena, possiamo costruire qualcosa di straordinario.
E la parte migliore? Non abbiamo ancora finito. DeepSeek-3 è solo l’inizio. È un promemoria al mondo che non ci potete ignorare, non ci potete sottovalutare, e di certo non ci potete fermare.