DeepSeek AI: Tidak Mampu, berharga $ 1.6 bilion untuk berkembang
Deepseek, permulaan Cina yang terkenal, telah membuat gelombang penting dalam industri AI dengan chatbot terkini, yang mempunyai pengenalan yang unik: "Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda." Kenyataan berani ini mencerminkan teknologi inovatif di sebalik model AI Deepseek, yang telah menyumbang kepada salah satu penurunan harga saham terbesar di Nvidia kerana kelebihan daya saing mereka di pasaran.
Ciri -ciri yang menonjol dari DeepSeek's AI termasuk:
- Ramalan Multi-Token (MTP) : Tidak seperti model tradisional yang meramalkan satu perkataan pada satu masa, model DeepSeek meramalkan pelbagai perkataan secara serentak, meningkatkan kedua-dua ketepatan dan kecekapan dengan menganalisis bahagian-bahagian yang berlainan.
- Campuran Pakar (MOE) : Senibina ini memanfaatkan rangkaian saraf 256, dengan lapan diaktifkan untuk setiap tugas pemprosesan token, mempercepatkan latihan AI dan meningkatkan prestasi.
- Perhatian Laten Multi-Head (MLA) : Mekanisme ini memberi tumpuan kepada bahagian-bahagian penting dalam satu kalimat, berulang kali mengeluarkan butiran utama untuk meminimumkan peluang kehilangan maklumat penting, dengan itu menangkap data bernuansa dengan berkesan.
Deepseek mendakwa telah melatih rangkaian sarafnya yang kuat, DeepSeek V3, hanya $ 6 juta menggunakan hanya 2048 pemproses grafik. Walau bagaimanapun, siasatan yang lebih mendalam oleh semianalysis mendedahkan infrastruktur yang lebih luas, termasuk kira -kira 50,000 GPU NVIDIA Hopper di beberapa pusat data. Ini termasuk 10,000 unit H800, 10,000 H100s, dan GPU tambahan H20, yang digunakan bukan sahaja untuk latihan AI tetapi juga untuk penyelidikan dan pemodelan kewangan. Jumlah pelaburan syarikat dalam pelayan mencapai kira -kira $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan $ 944 juta.
Sebagai anak syarikat dana lindung nilai Cina yang tinggi, DeepSeek beroperasi secara bebas, memiliki pusat datanya. Otonomi ini membolehkan inovasi dan pelaksanaan yang lebih cepat, kerana syarikat itu dibiayai sendiri dan tidak terjejas oleh proses birokrasi luaran. DeepSeek juga menarik bakat teratas dari universiti -universiti China yang terkemuka, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setahun.
Walaupun tuntutan kos latihan $ 6 juta, angka ini hanya meliputi penggunaan GPU semasa latihan pra-latihan dan tidak termasuk perbelanjaan yang lebih luas seperti penyelidikan, penghalusan model, pemprosesan data, atau kos infrastruktur. Sejak penubuhannya, DeepSeek telah melabur lebih daripada $ 500 juta dalam pembangunan AI, memanfaatkan struktur padatnya untuk memacu inovasi AI yang berkesan.
Perjalanan Deepseek menyoroti bagaimana syarikat AI yang dibiayai dengan baik dapat mencabar gergasi industri. Walau bagaimanapun, kejayaan syarikat disebabkan oleh pelaburan yang besar, terobosan teknikal, dan pasukan yang kuat, bukannya "bajet revolusioner." Walaupun kos pesaing lebih tinggi -Deepseek menghabiskan $ 5 juta pada R1 berbanding dengan $ 100 juta -Deepseek $ 100 juta tetap menjadi pemain yang hebat dalam landskap AI.
Imej: ensigame.com
Imej: ensigame.com
Imej: ensigame.com
Imej: ensigame.com
-
Apr 15,25"The Last of Us Season 2: Tarikh Siaran dan Panduan Streaming" Sebagai satu pertunjukan primetime HBO mengucapkan selamat tinggal (Selamat tinggal, Lotus White), satu lagi langkah yang bersemangat menjadi tumpuan. Dua tahun berikutan debut The Last of Us On Max, penyesuaian permainan video yang terkenal ini memaparkan Pedro Pascal dan Bella Ramsey sedang bersiap untuk kedua-duanya yang dinanti-nantikan
-
Jan 22,25Kingdom Hearts 4 Will Reboot the Series Kingdom Hearts creator Tetsuya Nomura recently hinted at a pivotal shift for the series with the upcoming fourth mainline installment. This article delves into his revelations about this crucial new chapter. Nomura Hints at a Series Conclusion with Kingdom Hearts 4 Kingdom Hearts 4: A Story Reset,
-
Jan 20,25‘Dungeons of Dreadrock 2’ Diumumkan, Dilancarkan pada Nintendo Switch pada bulan November dengan Versi Mudah Alih dan PC untuk Diikuti Kira-kira dua setengah tahun yang lalu, kami terpikat dengan perangkak penjara bawah tanah yang menarik, Dungeons of Dreadrock, yang dibangunkan oleh Christoph Minnameier. Permainan perspektif atas ke bawah ini, mengingatkan klasik seperti Dungeon Master dan Eye of the Beholder, menawarkan pengalaman menyelesaikan teka-teki yang unik acr
-
Dec 10,24Cosplay Marvel Emerges: Mohg Elden Ring Mengesankan Cosplay Mohg yang menakjubkan, sangat mirip dengan bos Elden Ring, telah dikongsi dalam talian, memikat komuniti permainan. Mohg, Lord of Blood, bos Demigod yang penting untuk mengakses rDLC Shadow of the Erdtree yang terkini, telah menikmati rpenonjolan yang diperbaharui. Elden Ring, kejayaan FromSoftware rdilepaskan dalam