DeepSeek AI: non conveniente, costa $ 1,6 miliardi per lo sviluppo
DeepSeek, un'importante startup cinese, ha fatto ondate significative nel settore dell'IA con il suo ultimo chatbot, che vanta un'introduzione unica: "Ciao, sono stato creato in modo da poter chiedere qualsiasi cosa e ottenere una risposta che potrebbe persino sorprenderti." Questa audace dichiarazione riflette le tecnologie innovative alla base dei modelli AI di Deepseek, che hanno contribuito a uno dei maggiori calo dei prezzi delle azioni di Nvidia a causa del loro vantaggio competitivo sul mercato.
Le caratteristiche straordinarie dell'intelligenza artificiale di Deepseek includono:
- Multi-token Prediction (MTP) : a differenza dei modelli tradizionali che prevedono una parola alla volta, il modello di DeepSeek prevede più parole contemporaneamente, migliorando sia l'accuratezza che l'efficienza analizzando diverse parti di una frase.
- Miscela di esperti (MOE) : questa architettura sfrutta 256 reti neurali, con otto attivate per ogni attività di elaborazione dei token, accelerando la formazione dell'IA e migliorando le prestazioni.
- Attenzione latente multi-testa (MLA) : questo meccanismo si concentra su parti cruciali di una frase, estraendo ripetutamente dettagli chiave per ridurre al minimo la possibilità di perdere informazioni importanti, catturando così i dati sfumati in modo efficace.
DeepSeek afferma di aver addestrato la sua potente rete neurale, Deepseek V3, per soli $ 6 milioni utilizzando solo 2048 processori grafici. Tuttavia, un'indagine più approfondita da parte di seminalisi ha rivelato un'infrastruttura più ampia, tra cui circa 50.000 GPU di Nvidia Hopper in diversi data center. Ciò include 10.000 unità H800, 10.000 H100 e GPU H20 aggiuntive, utilizzate non solo per la formazione AI ma anche per la ricerca e la modellazione finanziaria. L'investimento totale della società nei server raggiunge circa $ 1,6 miliardi, con spese operative stimate in $ 944 milioni.
Come filiale dell'hedge fund cinese High-Flyer, DeepSeek opera in modo indipendente, possedendo i suoi data center. Questa autonomia consente un'innovazione e implementazione più rapide, poiché l'azienda è autofinanziata e non impantanata da processi burocratici esterni. DeepSeek attira anche i migliori talenti delle principali università cinesi, con alcuni ricercatori che guadagnano oltre $ 1,3 milioni all'anno.
Nonostante l'affermazione di un costo di formazione di $ 6 milioni, questa cifra copre solo l'utilizzo della GPU durante il pre-allenamento e non include spese più ampie come ricerca, perfezionamento del modello, elaborazione dei dati o costi di infrastruttura. Fin dalla sua istituzione, DeepSeek ha investito oltre $ 500 milioni nello sviluppo dell'IA, sfruttando la sua struttura compatta per guidare efficaci innovazioni di intelligenza artificiale.
Il viaggio di Deepseek evidenzia come un'azienda di intelligenza artificiale indipendente ben finanziata può sfidare i giganti del settore. Tuttavia, il successo dell'azienda è attribuito a investimenti sostanziali, scoperte tecniche e una squadra forte, piuttosto che un "budget rivoluzionario". Mentre i costi dei concorrenti sono notevolmente più alti - Deepseek ha speso $ 5 milioni su R1 rispetto ai $ 100 milioni di Chatgpt4o - Deepseek rimane un giocatore formidabile nel panorama dell'IA.
Immagine: Ensigame.com
Immagine: Ensigame.com
Immagine: Ensigame.com
Immagine: Ensigame.com
-
Apr 15,25"The Last Of Us Season 2: Data di rilascio e Guida allo streaming" Mentre uno spettacolo di prima serata offre addio (arrivederci, il loto bianco), un altro entusiasmamente si mette sotto i riflettori. Due anni dopo il debutto di The Last of Us on Max, questo adattamento di videogiochi acclamato dalla critica con Pedro Pascal e Bella Ramsey si sta preparando per il suo tanto atteso secondo
-
Jan 22,25Kingdom Hearts 4 Will Reboot the Series Kingdom Hearts creator Tetsuya Nomura recently hinted at a pivotal shift for the series with the upcoming fourth mainline installment. This article delves into his revelations about this crucial new chapter. Nomura Hints at a Series Conclusion with Kingdom Hearts 4 Kingdom Hearts 4: A Story Reset,
-
Jan 20,25Annunciato "Dungeons of Dreadrock 2", in arrivo su Nintendo Switch a novembre e a seguire le versioni mobile e PC Circa due anni e mezzo fa, siamo rimasti affascinati dal delizioso dungeon crawler, Dungeons of Dreadrock, sviluppato da Christoph Minnameier. Questo gioco con prospettiva dall'alto verso il basso, che ricorda classici come Dungeon Master e Eye of the Beholder, offre un'esperienza unica di risoluzione di enigmi
-
Dec 10,24Il cosplay Marvel emerge: Mohg di Elden Ring impressiona Uno straordinario cosplay di Mohg, straordinariamente simile al boss Elden Ring, è stato condiviso online, affascinando la comunità dei giocatori. Mohg, Lord of Blood, un boss semidio cruciale per accedere al rultimo DLC Shadow of the Erdtree, ha goduto di rnuova importanza. Elden Ring, un trionfo di FromSoftware rpubblicato