DeepSeek AI: Tidak Mampu, berharga $ 1.6 bilion untuk berkembang

Rumah > Berita > DeepSeek AI: Tidak Mampu, berharga $ 1.6 bilion untuk berkembang

DeepSeek AI: Tidak Mampu, berharga $ 1.6 bilion untuk berkembang

May 18,25

Deepseek, permulaan Cina yang terkenal, telah membuat gelombang penting dalam industri AI dengan chatbot terkini, yang mempunyai pengenalan yang unik: "Hai, saya dicipta supaya anda boleh meminta apa -apa dan mendapatkan jawapan yang mungkin mengejutkan anda." Kenyataan berani ini mencerminkan teknologi inovatif di sebalik model AI Deepseek, yang telah menyumbang kepada salah satu penurunan harga saham terbesar di Nvidia kerana kelebihan daya saing mereka di pasaran.

Ciri -ciri yang menonjol dari DeepSeek's AI termasuk:

Ramalan Multi-Token (MTP) : Tidak seperti model tradisional yang meramalkan satu perkataan pada satu masa, model DeepSeek meramalkan pelbagai perkataan secara serentak, meningkatkan kedua-dua ketepatan dan kecekapan dengan menganalisis bahagian-bahagian yang berlainan.
Campuran Pakar (MOE) : Senibina ini memanfaatkan rangkaian saraf 256, dengan lapan diaktifkan untuk setiap tugas pemprosesan token, mempercepatkan latihan AI dan meningkatkan prestasi.
Perhatian Laten Multi-Head (MLA) : Mekanisme ini memberi tumpuan kepada bahagian-bahagian penting dalam satu kalimat, berulang kali mengeluarkan butiran utama untuk meminimumkan peluang kehilangan maklumat penting, dengan itu menangkap data bernuansa dengan berkesan.

Deepseek mendakwa telah melatih rangkaian sarafnya yang kuat, DeepSeek V3, hanya $ 6 juta menggunakan hanya 2048 pemproses grafik. Walau bagaimanapun, siasatan yang lebih mendalam oleh semianalysis mendedahkan infrastruktur yang lebih luas, termasuk kira -kira 50,000 GPU NVIDIA Hopper di beberapa pusat data. Ini termasuk 10,000 unit H800, 10,000 H100s, dan GPU tambahan H20, yang digunakan bukan sahaja untuk latihan AI tetapi juga untuk penyelidikan dan pemodelan kewangan. Jumlah pelaburan syarikat dalam pelayan mencapai kira -kira $ 1.6 bilion, dengan perbelanjaan operasi dianggarkan $ 944 juta.

Sebagai anak syarikat dana lindung nilai Cina yang tinggi, DeepSeek beroperasi secara bebas, memiliki pusat datanya. Otonomi ini membolehkan inovasi dan pelaksanaan yang lebih cepat, kerana syarikat itu dibiayai sendiri dan tidak terjejas oleh proses birokrasi luaran. DeepSeek juga menarik bakat teratas dari universiti -universiti China yang terkemuka, dengan beberapa penyelidik memperoleh lebih dari $ 1.3 juta setahun.

Walaupun tuntutan kos latihan $ 6 juta, angka ini hanya meliputi penggunaan GPU semasa latihan pra-latihan dan tidak termasuk perbelanjaan yang lebih luas seperti penyelidikan, penghalusan model, pemprosesan data, atau kos infrastruktur. Sejak penubuhannya, DeepSeek telah melabur lebih daripada $ 500 juta dalam pembangunan AI, memanfaatkan struktur padatnya untuk memacu inovasi AI yang berkesan.

Perjalanan Deepseek menyoroti bagaimana syarikat AI yang dibiayai dengan baik dapat mencabar gergasi industri. Walau bagaimanapun, kejayaan syarikat disebabkan oleh pelaburan yang besar, terobosan teknikal, dan pasukan yang kuat, bukannya "bajet revolusioner." Walaupun kos pesaing lebih tinggi -Deepseek menghabiskan $ 5 juta pada R1 berbanding dengan $ 100 juta -Deepseek $ 100 juta tetap menjadi pemain yang hebat dalam landskap AI.

Ujian DeepSeek Imej: ensigame.com

DeepSeek V3 Imej: ensigame.com

Deepseek Imej: ensigame.com

Seterusnya

Kerosakan percikan membatalkan transformer: diaktifkan semula

Berita Teratas

Lagi