DeepSeek AI:不起作用,开发耗资16亿美元

May 18,25

DeepSeek是一家著名的中国初创公司,其最新的聊天机器人在AI行业中引起了巨大的浪潮,该聊天机器人拥有独特的介绍:“嗨,我是被创建的,所以您可以问任何东西,并得到一个甚至可能会让您感到惊讶的答案。”这一大胆的声明反映了DeepSeek AI模型背后的创新技术,该技术因其在市场上的竞争优势而导致了NVIDIA最大的股票价格下跌之一。

DeepSeek AI的杰出特征包括:

  • 多语预测(MTP) :与一次预测一个单词的传统模型不同,DeepSeek的模型同时预测了多个单词,从而通过分析句子的不同部分来提高准确性和效率。
  • 专家的混合物(MOE) :该体系结构利用256个神经网络,每个令牌处理任务都激活了8个神经网络,从而加快了AI训练并提高了性能。
  • 多头潜在注意力(MLA) :这种机制着重于句子的重要部分,反复提取关键细节以最大程度地减少缺少重要信息的机会,从而有效地捕获细微的数据。

DeepSeek声称已经使用2048个图形处理器以600万美元的价格培训了其强大的神经网络DeepSeek V3。然而,对半分析进行了更深入的研究表明,基础设施更广泛,包括几个数据中心的大约50,000个NVIDIA HOPPER GPU。其中包括10,000个H800单元,10,000 H100和其他H20 GPU,不仅用于AI培训,还用于研究和财务建模。该公司对服务器的总投资约为16亿美元,运营费用估计为9.44亿美元。

作为中国对冲基金高级基金的子公司,DeepSeek独立运营,拥有其数据中心。这种自主权允许更快的创新和实施,因为公司是自筹资金的,并且不会因外部官僚流程而陷入困境。 DeepSeek还吸引了领先的中国大学的顶尖人才,一些研究人员每年收入超过130万美元。

尽管声称有600万美元的培训费用,但该数字仅涵盖培训期间的GPU使用情况,并且不包括更广泛的费用,例如研究,改进,数据处理或基础设施成本。自成立以来,DeepSeek已在AI开发方面投资了超过5亿美元,利用其紧凑的结构来推动有效的AI创新。

DeepSeek的旅程强调了一家资金充足的独立AI公司如何挑战行业巨头。但是,该公司的成功归因于大量投资,技术突破和强大的团队,而不是“革命预算”。尽管竞争对手的成本明显更高,而Deepseek在R1上花费了500万美元,而Chatgpt4o的1亿美元,Deepseek仍然是AI景观中的强大参与者。

DeepSeek测试图片:ensigame.com

DeepSeek V3图片:ensigame.com

DeepSeek图片:ensigame.com

DeepSeek图片:ensigame.com

热门新闻
更多
Copyright © 2024 yuzsb.com All rights reserved.