Deepseek AI: Uygun fiyatlı değil, geliştirmek için 1,6 milyar dolara mal oldu

May 18,25

Önemli bir Çin girişim olan Deepseek, benzersiz bir tanıtımla övünen en son chatbot ile AI endüstrisinde önemli dalgalar yaptı: "Merhaba, yaratıldım, böylece bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz." Bu cesur ifade, Deepseek'in AI modellerinin arkasındaki yenilikçi teknolojileri, pazardaki rekabet avantajları nedeniyle NVIDIA'nın en büyük hisse senedi fiyat düşüşlerinden birine katkıda bulunan yenilikçi teknolojileri yansıtıyor.

Deepseek'in AI'sının göze çarpan özellikleri şunlardır:

  • Çoklu Tahmini Tahmin (MTP) : Bir seferde bir kelimeyi tahmin eden geleneksel modellerin aksine, Deepseek'in modeli aynı anda birden fazla kelimeyi tahmin ederek bir cümlenin farklı bölümlerini analiz ederek hem doğruluğu hem de verimliliği artırır.
  • Uzmanların Karışımı (MOE) : Bu mimari, her bir jeton işleme görevi için sekiz etkinleştirilmiş, AI eğitimini hızlandıran ve performansı artıran 256 sinir ağından yararlanır.
  • Çok Baş Gizli Dikkat (MLA) : Bu mekanizma, bir cümlenin önemli kısımlarına odaklanır ve önemli bilgileri kaçırma şansını en aza indirmek için önemli ayrıntıları tekrar tekrar çıkarır ve böylece nüanslı verileri etkili bir şekilde yakalar.

Deepseek, güçlü sinir ağı Deepseek V3'ü sadece 2048 grafik işlemciyi kullanarak sadece 6 milyon dolara eğittiğini iddia ediyor. Bununla birlikte, yarı tahliye tarafından daha derin bir araştırma, birkaç veri merkezinde yaklaşık 50.000 NVIDIA hopper GPU'ları da dahil olmak üzere daha kapsamlı bir altyapı ortaya çıkarmıştır. Bu, sadece AI eğitimi için değil, aynı zamanda araştırma ve finansal modelleme için de kullanılan 10.000 H800 birim, 10.000 H100 ve ek H20 GPU'yu içerir. Şirketin sunuculara toplam yatırımı yaklaşık 1,6 milyar dolara ulaşıyor ve operasyonel giderlerin 944 milyon dolar olduğu tahmin ediliyor.

Çin Hedge Fonu High-Flyer'ın bir yan kuruluşu olan Deepseek, veri merkezlerine sahip olarak bağımsız olarak faaliyet göstermektedir. Bu özerklik, şirket kendi kendine finanse edildiğinden ve dış bürokratik süreçlerle boğulmadığı için daha hızlı inovasyon ve uygulamaya izin verir. Deepseek ayrıca önde gelen Çin üniversitelerinden en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1.3 milyon doların üzerinde kazanıyor.

6 milyon dolarlık bir eğitim maliyeti iddiasına rağmen, bu rakam yalnızca eğitim öncesi sırasında GPU kullanımını kapsamaktadır ve araştırma, model iyileştirme, veri işleme veya altyapı maliyetleri gibi daha geniş giderleri içermez. Deepseek, kuruluşundan bu yana, AI gelişimine 500 milyon doların üzerinde yatırım yaptı ve etkili AI yeniliklerini artırmak için kompakt yapısını kullandı.

Deepseek'in yolculuğu, iyi finanse edilen, bağımsız bir AI şirketinin endüstri devlerine nasıl meydan okuyabileceğini vurgular. Bununla birlikte, şirketin başarısı "devrimci bir bütçe" yerine önemli yatırımlara, teknik atılımlara ve güçlü bir ekibe atfedilmektedir. Rakiplerin maliyetleri oldukça yüksek olsa da - Deepseek, ChatGpt4o'nun 100 milyon dolarına kıyasla R1'e 5 milyon dolar harcadı - Deepseek AI manzarasında müthiş bir oyuncu olmaya devam ediyor.

Deepseek Testi Resim: ensigame.com

Deepseek V3 Resim: ensigame.com

Deepseek Resim: ensigame.com

Deepseek Resim: ensigame.com

En Önemli Haberler
Daha
Copyright © 2024 yuzsb.com All rights reserved.