DeepSeek AI:不起作用,开发耗资16亿美元
DeepSeek是一家著名的中国初创公司,其最新的聊天机器人在AI行业中引起了巨大的浪潮,该聊天机器人拥有独特的介绍:“嗨,我是被创建的,所以您可以问任何东西,并得到一个甚至可能会让您感到惊讶的答案。”这一大胆的声明反映了DeepSeek AI模型背后的创新技术,该技术因其在市场上的竞争优势而导致了NVIDIA最大的股票价格下跌之一。
DeepSeek AI的杰出特征包括:
- 多语预测(MTP) :与一次预测一个单词的传统模型不同,DeepSeek的模型同时预测了多个单词,从而通过分析句子的不同部分来提高准确性和效率。
- 专家的混合物(MOE) :该体系结构利用256个神经网络,每个令牌处理任务都激活了8个神经网络,从而加快了AI训练并提高了性能。
- 多头潜在注意力(MLA) :这种机制着重于句子的重要部分,反复提取关键细节以最大程度地减少缺少重要信息的机会,从而有效地捕获细微的数据。
DeepSeek声称已经使用2048个图形处理器以600万美元的价格培训了其强大的神经网络DeepSeek V3。然而,对半分析进行了更深入的研究表明,基础设施更广泛,包括几个数据中心的大约50,000个NVIDIA HOPPER GPU。其中包括10,000个H800单元,10,000 H100和其他H20 GPU,不仅用于AI培训,还用于研究和财务建模。该公司对服务器的总投资约为16亿美元,运营费用估计为9.44亿美元。
作为中国对冲基金高级基金的子公司,DeepSeek独立运营,拥有其数据中心。这种自主权允许更快的创新和实施,因为公司是自筹资金的,并且不会因外部官僚流程而陷入困境。 DeepSeek还吸引了领先的中国大学的顶尖人才,一些研究人员每年收入超过130万美元。
尽管声称有600万美元的培训费用,但该数字仅涵盖培训期间的GPU使用情况,并且不包括更广泛的费用,例如研究,改进,数据处理或基础设施成本。自成立以来,DeepSeek已在AI开发方面投资了超过5亿美元,利用其紧凑的结构来推动有效的AI创新。
DeepSeek的旅程强调了一家资金充足的独立AI公司如何挑战行业巨头。但是,该公司的成功归因于大量投资,技术突破和强大的团队,而不是“革命预算”。尽管竞争对手的成本明显更高,而Deepseek在R1上花费了500万美元,而Chatgpt4o的1亿美元,Deepseek仍然是AI景观中的强大参与者。
图片:ensigame.com
图片:ensigame.com
图片:ensigame.com
图片:ensigame.com
-
-
Jan 22,25Kingdom Hearts 4 Will Reboot the Series Kingdom Hearts creator Tetsuya Nomura recently hinted at a pivotal shift for the series with the upcoming fourth mainline installment. This article delves into his revelations about this crucial new chapter. Nomura Hints at a Series Conclusion with Kingdom Hearts 4 Kingdom Hearts 4: A Story Reset,
-
-