दीपसेक एआई: सस्ती नहीं, विकसित करने के लिए $ 1.6 बिलियन की लागत

May 18,25

दीपसेक, एक प्रमुख चीनी स्टार्टअप, ने अपने नवीनतम चैटबॉट के साथ एआई उद्योग में महत्वपूर्ण लहरें बनाई हैं, जो एक अनूठा परिचय का दावा करता है: "हाय, मैं बनाया गया था ताकि आप कुछ भी पूछ सकें और एक उत्तर प्राप्त कर सकें जो आपको आश्चर्यचकित भी कर सके।" यह बोल्ड स्टेटमेंट डीपसेक के एआई मॉडल के पीछे की अभिनव प्रौद्योगिकियों को दर्शाता है, जिन्होंने बाजार में उनके प्रतिस्पर्धात्मक बढ़त के कारण एनवीडिया के सबसे बड़े स्टॉक मूल्य की गिरावट में से एक में योगदान दिया है।

दीपसेक के एआई की स्टैंडआउट विशेषताओं में शामिल हैं:

  • मल्टी-टोकन भविष्यवाणी (एमटीपी) : पारंपरिक मॉडल के विपरीत जो एक समय में एक शब्द की भविष्यवाणी करते हैं, डीपसेक के मॉडल ने एक साथ कई शब्दों का अनुमान लगाया है, जो एक वाक्य के विभिन्न हिस्सों का विश्लेषण करके सटीकता और दक्षता दोनों को बढ़ाता है।
  • विशेषज्ञों का मिश्रण (MOE) : यह आर्किटेक्चर 256 तंत्रिका नेटवर्क का लाभ उठाता है, जिसमें प्रत्येक टोकन प्रसंस्करण कार्य के लिए आठ सक्रिय होते हैं, एआई प्रशिक्षण को तेज करते हैं और प्रदर्शन में सुधार करते हैं।
  • मल्टी-हेड लेटेंट ध्यान (एमएलए) : यह तंत्र एक वाक्य के महत्वपूर्ण हिस्सों पर केंद्रित है, बार-बार महत्वपूर्ण जानकारी को लापता करने की संभावना को कम करने के लिए महत्वपूर्ण विवरण निकालता है, जिससे बारीक डेटा को प्रभावी ढंग से कैप्चर किया जाता है।

दीपसेक ने दावा किया है कि केवल 2048 ग्राफिक्स प्रोसेसर का उपयोग करके केवल $ 6 मिलियन के लिए अपने शक्तिशाली तंत्रिका नेटवर्क, डीपसेक वी 3 को प्रशिक्षित किया गया है। हालांकि, सेमियालिसिस द्वारा एक गहरी जांच में कई डेटा केंद्रों में लगभग 50,000 एनवीडिया हॉपर जीपीयू सहित अधिक व्यापक बुनियादी ढांचे का पता चला। इसमें 10,000 H800 इकाइयां, 10,000 H100, और अतिरिक्त H20 GPU शामिल हैं, न केवल AI प्रशिक्षण के लिए, बल्कि अनुसंधान और वित्तीय मॉडलिंग के लिए भी उपयोग किया जाता है। सर्वर में कंपनी का कुल निवेश लगभग 1.6 बिलियन डॉलर तक पहुंच जाता है, जिसमें परिचालन खर्च $ 944 मिलियन का अनुमान है।

चाइनीज हेज फंड हाई-फ्लायर की सहायक कंपनी के रूप में, डीपसेक अपने डेटा सेंटरों के मालिक होने के साथ स्वतंत्र रूप से संचालित होता है। यह स्वायत्तता तेजी से नवाचार और कार्यान्वयन के लिए अनुमति देती है, क्योंकि कंपनी स्व-वित्त पोषित है और बाहरी नौकरशाही प्रक्रियाओं से टकराया नहीं है। दीपसेक भी प्रमुख चीनी विश्वविद्यालयों से शीर्ष प्रतिभाओं को आकर्षित करता है, कुछ शोधकर्ताओं ने सालाना 1.3 मिलियन डॉलर से अधिक की कमाई की।

$ 6 मिलियन प्रशिक्षण लागत के दावे के बावजूद, यह आंकड़ा केवल पूर्व-प्रशिक्षण के दौरान GPU उपयोग को कवर करता है और इसमें अनुसंधान, मॉडल शोधन, डेटा प्रसंस्करण, या बुनियादी ढांचे की लागत जैसे व्यापक खर्च शामिल नहीं हैं। अपनी स्थापना के बाद से, डीपसेक ने एआई विकास में $ 500 मिलियन से अधिक का निवेश किया है, जो प्रभावी एआई नवाचारों को चलाने के लिए अपनी कॉम्पैक्ट संरचना का लाभ उठाता है।

दीपसेक की यात्रा पर प्रकाश डाला गया है कि कैसे एक अच्छी तरह से वित्त पोषित, स्वतंत्र एआई कंपनी उद्योग के दिग्गजों को चुनौती दे सकती है। हालांकि, कंपनी की सफलता को "क्रांतिकारी बजट" के बजाय पर्याप्त निवेश, तकनीकी सफलताओं और एक मजबूत टीम के लिए जिम्मेदार ठहराया जाता है। जबकि प्रतियोगियों की लागत विशेष रूप से अधिक है - डीपसेक ने R1 पर $ 5 मिलियन खर्च किए, जो कि Chatgpt4o के $ 100 मिलियन की तुलना में - Deepseek AI परिदृश्य में एक दुर्जेय खिलाड़ी बना हुआ है।

दीपसेक टेस्ट चित्र: ensigame.com

दीपसेक वी 3 चित्र: ensigame.com

दीपसेक चित्र: ensigame.com

दीपसेक चित्र: ensigame.com

मुख्य समाचार
अधिक
Copyright © 2024 yuzsb.com All rights reserved.