Deepseek AI: ไม่แพงราคา 1.6 พันล้านเหรียญสหรัฐในการพัฒนา

May 18,25

Deepseek การเริ่มต้นของจีนที่โดดเด่นได้สร้างคลื่นที่สำคัญในอุตสาหกรรม AI ด้วย chatbot ล่าสุดซึ่งมีการแนะนำที่ไม่เหมือนใคร: "สวัสดีฉันถูกสร้างขึ้นเพื่อให้คุณสามารถถามอะไรก็ได้และรับคำตอบที่อาจทำให้คุณประหลาดใจ" คำแถลงที่กล้าหาญนี้สะท้อนให้เห็นถึงเทคโนโลยีที่เป็นนวัตกรรมที่อยู่เบื้องหลังโมเดล AI ของ Deepseek ซึ่งมีส่วนทำให้ราคาหุ้นที่ใหญ่ที่สุดของ Nvidia ลดลงเนื่องจากความได้เปรียบในการแข่งขันในตลาด

คุณสมบัติที่โดดเด่นของ AI ของ Deepseek รวมถึง:

  • Multi-Token Prediction (MTP) : ซึ่งแตกต่างจากแบบจำลองดั้งเดิมที่ทำนายคำทีละคำในแต่ละคำว่าโมเดลของ Deepseek คาดการณ์หลายคำพร้อมกันเพิ่มความแม่นยำและประสิทธิภาพโดยการวิเคราะห์ส่วนต่าง ๆ ของประโยค
  • ส่วนผสมของผู้เชี่ยวชาญ (MOE) : สถาปัตยกรรมนี้ใช้ประโยชน์จากเครือข่ายประสาท 256 แห่งโดยมีการเปิดใช้งานแปดครั้งสำหรับงานประมวลผลโทเค็นแต่ละครั้งเร่งการฝึกอบรม AI และปรับปรุงประสิทธิภาพ
  • ความสนใจแฝงหลายหัว (MLA) : กลไกนี้มุ่งเน้นไปที่ส่วนที่สำคัญของประโยคการแยกรายละเอียดสำคัญซ้ำ ๆ เพื่อลดโอกาสของข้อมูลที่สำคัญที่ขาดหายไป

Deepseek อ้างว่าได้ฝึกอบรมเครือข่ายประสาทที่ทรงพลัง Deepseek V3 ในราคาเพียง 6 ล้านเหรียญสหรัฐโดยใช้โปรเซสเซอร์กราฟิกเพียง 2048 อย่างไรก็ตามการตรวจสอบที่ลึกซึ้งยิ่งขึ้นโดย semianalysis เผยให้เห็นโครงสร้างพื้นฐานที่กว้างขวางมากขึ้นรวมถึง GPU Nvidia Hopper ประมาณ 50,000 แห่งในศูนย์ข้อมูลหลายแห่ง ซึ่งรวมถึง 10,000 H800 หน่วย, 10,000 H100s และ H20 GPU เพิ่มเติมที่ใช้ไม่เพียง แต่สำหรับการฝึกอบรม AI แต่ยังรวมถึงการวิจัยและการสร้างแบบจำลองทางการเงิน การลงทุนทั้งหมดของ บริษัท ในเซิร์ฟเวอร์สูงถึง 1.6 พันล้านดอลลาร์โดยมีค่าใช้จ่ายในการดำเนินงานอยู่ที่ 944 ล้านดอลลาร์

ในฐานะที่เป็น บริษัท ย่อยของกองทุนป้องกันความเสี่ยงของจีน Deepseek ทำงานอย่างอิสระเป็นเจ้าของศูนย์ข้อมูล ความเป็นอิสระนี้ช่วยให้นวัตกรรมและการนำไปปฏิบัติได้เร็วขึ้นเนื่องจาก บริษัท ได้รับการสนับสนุนตนเองและไม่จมอยู่กับกระบวนการราชการภายนอก Deepseek ยังดึงดูดความสามารถสูงสุดจากมหาวิทยาลัยชั้นนำของจีนโดยมีนักวิจัยบางคนมีรายได้มากกว่า 1.3 ล้านเหรียญสหรัฐต่อปี

แม้จะมีการเรียกร้องค่าใช้จ่ายในการฝึกอบรม $ 6 ล้านตัวเลขนี้ครอบคลุมเฉพาะการใช้ GPU ในระหว่างการฝึกอบรมก่อนและไม่รวมค่าใช้จ่ายที่กว้างขึ้นเช่นการวิจัยการปรับแต่งแบบจำลองการประมวลผลข้อมูลหรือค่าใช้จ่ายโครงสร้างพื้นฐาน นับตั้งแต่ก่อตั้งขึ้น Deepseek ได้ลงทุนกว่า 500 ล้านเหรียญสหรัฐในการพัฒนา AI ซึ่งใช้ประโยชน์จากโครงสร้างขนาดกะทัดรัดเพื่อผลักดันนวัตกรรม AI ที่มีประสิทธิภาพ

การเดินทางของ Deepseek เน้นว่า บริษัท AI อิสระที่ได้รับการสนับสนุนอย่างดีสามารถท้าทายยักษ์ใหญ่ในอุตสาหกรรมได้อย่างไร อย่างไรก็ตามความสำเร็จของ บริษัท นั้นมาจากการลงทุนที่สำคัญการพัฒนาทางเทคนิคและทีมที่แข็งแกร่งแทนที่จะเป็น "งบประมาณปฏิวัติ" ในขณะที่ค่าใช้จ่ายของคู่แข่งสูงขึ้นอย่างเห็นได้ชัด - Deepseek ใช้จ่าย $ 5 ล้านใน R1 เมื่อเทียบกับ CHATGPT4O ของ $ 100 ล้าน - Deepseek ยังคงเป็นผู้เล่นที่น่าเกรงขามในภูมิทัศน์ AI

การทดสอบลึกรูปภาพ: Ensigame.com

deepseek v3 รูปภาพ: Ensigame.com

ลึกล้ำ รูปภาพ: Ensigame.com

ลึกล้ำ รูปภาพ: Ensigame.com

ข่าวเด่น
มากกว่า
Copyright © 2024 yuzsb.com All rights reserved.