Deepseek AI: Uygun fiyatlı değil, geliştirmek için 1,6 milyar dolara mal oldu
Önemli bir Çin girişim olan Deepseek, benzersiz bir tanıtımla övünen en son chatbot ile AI endüstrisinde önemli dalgalar yaptı: "Merhaba, yaratıldım, böylece bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz." Bu cesur ifade, Deepseek'in AI modellerinin arkasındaki yenilikçi teknolojileri, pazardaki rekabet avantajları nedeniyle NVIDIA'nın en büyük hisse senedi fiyat düşüşlerinden birine katkıda bulunan yenilikçi teknolojileri yansıtıyor.
Deepseek'in AI'sının göze çarpan özellikleri şunlardır:
- Çoklu Tahmini Tahmin (MTP) : Bir seferde bir kelimeyi tahmin eden geleneksel modellerin aksine, Deepseek'in modeli aynı anda birden fazla kelimeyi tahmin ederek bir cümlenin farklı bölümlerini analiz ederek hem doğruluğu hem de verimliliği artırır.
- Uzmanların Karışımı (MOE) : Bu mimari, her bir jeton işleme görevi için sekiz etkinleştirilmiş, AI eğitimini hızlandıran ve performansı artıran 256 sinir ağından yararlanır.
- Çok Baş Gizli Dikkat (MLA) : Bu mekanizma, bir cümlenin önemli kısımlarına odaklanır ve önemli bilgileri kaçırma şansını en aza indirmek için önemli ayrıntıları tekrar tekrar çıkarır ve böylece nüanslı verileri etkili bir şekilde yakalar.
Deepseek, güçlü sinir ağı Deepseek V3'ü sadece 2048 grafik işlemciyi kullanarak sadece 6 milyon dolara eğittiğini iddia ediyor. Bununla birlikte, yarı tahliye tarafından daha derin bir araştırma, birkaç veri merkezinde yaklaşık 50.000 NVIDIA hopper GPU'ları da dahil olmak üzere daha kapsamlı bir altyapı ortaya çıkarmıştır. Bu, sadece AI eğitimi için değil, aynı zamanda araştırma ve finansal modelleme için de kullanılan 10.000 H800 birim, 10.000 H100 ve ek H20 GPU'yu içerir. Şirketin sunuculara toplam yatırımı yaklaşık 1,6 milyar dolara ulaşıyor ve operasyonel giderlerin 944 milyon dolar olduğu tahmin ediliyor.
Çin Hedge Fonu High-Flyer'ın bir yan kuruluşu olan Deepseek, veri merkezlerine sahip olarak bağımsız olarak faaliyet göstermektedir. Bu özerklik, şirket kendi kendine finanse edildiğinden ve dış bürokratik süreçlerle boğulmadığı için daha hızlı inovasyon ve uygulamaya izin verir. Deepseek ayrıca önde gelen Çin üniversitelerinden en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1.3 milyon doların üzerinde kazanıyor.
6 milyon dolarlık bir eğitim maliyeti iddiasına rağmen, bu rakam yalnızca eğitim öncesi sırasında GPU kullanımını kapsamaktadır ve araştırma, model iyileştirme, veri işleme veya altyapı maliyetleri gibi daha geniş giderleri içermez. Deepseek, kuruluşundan bu yana, AI gelişimine 500 milyon doların üzerinde yatırım yaptı ve etkili AI yeniliklerini artırmak için kompakt yapısını kullandı.
Deepseek'in yolculuğu, iyi finanse edilen, bağımsız bir AI şirketinin endüstri devlerine nasıl meydan okuyabileceğini vurgular. Bununla birlikte, şirketin başarısı "devrimci bir bütçe" yerine önemli yatırımlara, teknik atılımlara ve güçlü bir ekibe atfedilmektedir. Rakiplerin maliyetleri oldukça yüksek olsa da - Deepseek, ChatGpt4o'nun 100 milyon dolarına kıyasla R1'e 5 milyon dolar harcadı - Deepseek AI manzarasında müthiş bir oyuncu olmaya devam ediyor.
Resim: ensigame.com
Resim: ensigame.com
Resim: ensigame.com
Resim: ensigame.com
-
Apr 15,25"Sonuz Sezon 2: Çıkış Tarihi ve Akış Kılavuzu" Bir HBO primetime şovu veda eder (Güle güle, Beyaz Lotus), diğeri hevesle spot ışığına girer. Last of the Maks'ın ilk çıkışını takiben iki yıl sonra, Pedro Pascal ve Bella Ramsey'in yer aldığı eleştirmenlerce beğenilen video oyunu uyarlaması, çok beklenen saniye için hazırlanıyor
-
Jan 22,25Kingdom Hearts 4 Will Reboot the Series Kingdom Hearts creator Tetsuya Nomura recently hinted at a pivotal shift for the series with the upcoming fourth mainline installment. This article delves into his revelations about this crucial new chapter. Nomura Hints at a Series Conclusion with Kingdom Hearts 4 Kingdom Hearts 4: A Story Reset,
-
Jan 20,25'Dungeons of Dreadrock 2' Duyurdu, Kasım Ayında Nintendo Switch'te Çıkacak ve Mobil ve PC Sürümleri Takip Edilecek Yaklaşık iki buçuk yıl önce, Christoph Minnameier tarafından geliştirilen keyifli zindan tarayıcısı Dungeons of Dreadrock'un büyüsüne kapılmıştık. Dungeon Master ve Eye of the Beholder gibi klasikleri hatırlatan bu yukarıdan aşağıya perspektif oyunu, benzersiz bir bulmaca çözme deneyimi sunuyordu.
-
Dec 10,24Cosplay Marvel Ortaya Çıkıyor: Elden Ring'in Mohg'u Etkiliyor Elden'ing boss'a çarpıcı biçimde benzeyen çarpıcı bir Mohg cosplayi çevrimiçi olarak paylaşıldı ve oyun camiasının ilgisini çekti. Son Shadow of the Erdtree DLC'sine erişim için hayati önem taşıyan bir Yarı Tanrı patronu olan Lord of Blood Mohg, Ryeniden öne çıktı. Elden ring, bir FromSoftware zaferi rşu tarihte yayınlandı