Deepseek AI:手頃な価格ではなく、開発に16億ドルの費用がかかります

May 18,25

中国の著名なスタートアップであるDeepseekは、最新のチャットボットを備えたAI業界で大きな波を起こしました。これは、「こんにちは、私は何でも尋ねて驚かされるかもしれない答えを得ることができるように作成されました。」この大胆な声明は、DeepseekのAIモデルの背後にある革新的な技術を反映しており、市場での競争力のためにNvidiaの最大の株価下落の1つに貢献しています。

DeepseekのAIの傑出した機能は次のとおりです。

  • マルチトークン予測(MTP) :一度に1つの単語を予測する従来のモデルとは異なり、DeepSeekのモデルは複数の単語を同時に予測し、文のさまざまな部分を分析することで精度と効率の両方を向上させます。
  • 専門家(MOE)の混合:このアーキテクチャは、256個のニューラルネットワークを活用し、トークン処理タスクごとに8つがアクティブ化され、AIトレーニングの高速化とパフォーマンスの向上。
  • マルチヘッド潜在的注意(MLA) :このメカニズムは、文の重要な部分に焦点を当てており、重要な情報を欠く可能性を最小限に抑えるために重要な詳細を繰り返し抽出し、微妙なデータを効果的にキャプチャします。

Deepseekは、その強力なニューラルネットワークであるDeepseek V3をわずか600万ドルで訓練したと主張しています。ただし、セミアンアリシスによるより深い調査により、いくつかのデータセンターにわたって約50,000のNVIDIAホッパーGPUを含む、より広範なインフラストラクチャが明らかになりました。これには、AIトレーニングだけでなく、研究と財務モデリングにも使用される10,000 H800ユニット、10,000 H100、および追加のH20 GPUが含まれます。会社のサーバーへの総投資は約16億ドルに達し、運用費用は9億4,400万ドルと推定されています。

中国のヘッジファンドの子会社の高級選手として、Deepseekは独立して運営され、データセンターを所有しています。この自律性は、会社が自己資金提供されており、外部の官僚的なプロセスによって動揺していないため、より速いイノベーションと実装を可能にします。 Deepseekはまた、中国の主要な大学のトップの才能を引き付け、一部の研究者は年間130万ドル以上を稼いでいます。

600万ドルのトレーニングコストの請求にもかかわらず、この数字はトレーニング前のGPU使用のみをカバーしており、研究、モデルの洗練、データ処理、インフラストラクチャコストなどの幅広い費用は含まれていません。 Deepseekは設立以来、AI開発に5億ドル以上を投資しており、コンパクト構造を活用して効果的なAIイノベーションを促進しています。

Deepseekの旅は、資金提供された独立したAI企業が業界の巨人にどのように挑戦できるかを強調しています。ただし、同社の成功は、「革新的な予算」ではなく、実質的な投資、技術的なブレークスルー、および強力なチームに起因しています。競合他社のコストは特に高くなっていますが、DeepseekはChatGPT4Oの1億ドルと比較してR1に500万ドルを費やしましたが、DeepseekはAIランドスケープの恐ろしいプレーヤーのままです。

DeepSeekテスト画像:Ensigame.com

Deepseek V3画像:Ensigame.com

deepseek画像:Ensigame.com

deepseek画像:Ensigame.com

トップニュース
もっと
Copyright © 2024 yuzsb.com All rights reserved.