Deepseek AI: Nicht erschwinglich, kostet 1,6 Milliarden US -Dollar für die Entwicklung

May 18,25

Deepseek, ein prominentes chinesisches Startup, hat mit seinem neuesten Chatbot erhebliche Wellen in der KI -Branche geführt, die eine einzigartige Einführung aufweist: "Hallo, ich wurde erstellt, damit Sie alles fragen und eine Antwort erhalten können, die Sie sogar überraschen könnte." Diese mutige Erklärung spiegelt die innovativen Technologien hinter Deepseeks KI -Modellen wider, die aufgrund ihres Wettbewerbsvorteils auf dem Markt zu einem der größten Aktienkurs von NVIDIA beigetragen haben.

Zu den herausragenden Merkmalen von Deepseeks KI gehören:

  • Multi-Token-Vorhersage (MTP) : Im Gegensatz zu herkömmlichen Modellen, die jeweils ein Wort vorhersagen, prognostiziert das Modell von Deepseek mehrere Wörter gleichzeitig und verbessert sowohl die Genauigkeit als auch die Effizienz durch Analyse verschiedener Teile eines Satzes.
  • Mischung aus Experten (MOE) : Diese Architektur nutzt 256 neuronale Netze, wobei acht für jede Token -Verarbeitungsaufgabe aktiviert werden, die KI -Schulungen beschleunigen und die Leistung verbessern.
  • Multi-Head Latent Achtung (MLA) : Dieser Mechanismus konzentriert sich auf wichtige Teile eines Satzes und extrahiert wiederholt wichtige Details, um die Wahrscheinlichkeit von wichtigen Informationen zu minimieren, wodurch nuancierte Daten effektiv erfasst werden.

Deepseek behauptet, sein leistungsstarkes neuronales Netzwerk Deepseek V3 für nur 6 Millionen US -Dollar mit nur 2048 Grafikprozessoren ausgebildet zu haben. Eine tiefere Untersuchung durch semianalyse ergab jedoch eine umfangreichere Infrastruktur, darunter ungefähr 50.000 NVIDIA Hopper -GPUs in mehreren Rechenzentren. Dies umfasst 10.000 H800 -Einheiten, 10.000 H100 und zusätzliche H20 -GPUs, die nicht nur für die KI -Schulung, sondern auch für Forschungs- und Finanzmodellierung verwendet werden. Die Gesamtinvestition des Unternehmens in Server erreicht rund 1,6 Milliarden US -Dollar, wobei die operativen Ausgaben auf 944 Mio. USD geschätzt werden.

Als Tochtergesellschaft des Chinesischen Hedgefonds-High-Flyer arbeitet Deepseek unabhängig und besitzt seine Rechenzentren. Diese Autonomie ermöglicht eine schnellere Innovation und Implementierung, da das Unternehmen selbstfinanziert und nicht durch externe bürokratische Prozesse festgefahren ist. Deepseek zieht auch Top -Talente von führenden chinesischen Universitäten an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen.

Trotz der Behauptung von Schulungskosten in Höhe von 6 Millionen US-Dollar deckt diese Zahl nur während der Vorausbildung die GPU-Nutzung ab und enthält keine umfassenderen Ausgaben wie Forschung, Modellverfeinerung, Datenverarbeitung oder Infrastrukturkosten. Seit seiner Gründung hat Deepseek über 500 Millionen US -Dollar in die KI -Entwicklung investiert und seine kompakte Struktur nutzt, um effektive KI -Innovationen zu fördern.

Deepseeks Reise zeigt, wie ein gut finanziertes, unabhängiges KI-Unternehmen Branchenriesen herausfordern kann. Der Erfolg des Unternehmens wird jedoch auf erhebliche Investitionen, technische Durchbrüche und ein starkes Team und nicht auf ein "revolutionäres Budget" zurückgeführt. Während die Kosten der Wettbewerber deutlich höher sind - Deepseek gab im Vergleich zu den 100 Millionen US -Dollar von Chatgpt4o 5 Millionen US -Dollar für R1 aus - Deepseek bleibt ein beeindruckender Spieler in der KI -Landschaft.

Deepseek -Test Bild: Ensigame.com

Deepseek v3 Bild: Ensigame.com

Deepseek Bild: Ensigame.com

Deepseek Bild: Ensigame.com

Top-Nachrichten
Mehr
Copyright © 2024 yuzsb.com All rights reserved.