DeepSeek AI: Không giá cả phải chăng, chi phí 1,6 tỷ đô la để phát triển

May 18,25

Deepseek, một công ty khởi nghiệp nổi tiếng của Trung Quốc, đã tạo ra những làn sóng đáng kể trong ngành công nghiệp AI với chatbot mới nhất của mình, nơi tự hào về phần giới thiệu độc đáo: "Xin chào, tôi được tạo ra để bạn có thể hỏi bất cứ điều gì và nhận được câu trả lời thậm chí có thể làm bạn ngạc nhiên." Tuyên bố táo bạo này phản ánh các công nghệ sáng tạo đằng sau các mô hình AI của Deepseek, đã góp phần làm giảm giá cổ phiếu lớn nhất của Nvidia do lợi thế cạnh tranh của họ trên thị trường.

Các tính năng nổi bật của AI của Deepseek bao gồm:

  • Dự đoán đa điểm (MTP) : Không giống như các mô hình truyền thống dự đoán một từ tại một thời điểm, mô hình của Deepseek dự báo đồng thời nhiều từ, tăng cường cả độ chính xác và hiệu quả bằng cách phân tích các phần khác nhau của câu.
  • Hỗn hợp các chuyên gia (MOE) : Kiến trúc này tận dụng 256 mạng lưới thần kinh, với tám mạng được kích hoạt cho mỗi nhiệm vụ xử lý mã thông báo, tăng tốc độ đào tạo AI và cải thiện hiệu suất.
  • Sự chú ý tiềm ẩn đa đầu (MLA) : Cơ chế này tập trung vào các phần quan trọng của câu, liên tục trích xuất các chi tiết chính để giảm thiểu cơ hội thiếu thông tin quan trọng, do đó nắm bắt dữ liệu sắc thái một cách hiệu quả.

Deepseek tuyên bố đã đào tạo mạng lưới thần kinh mạnh mẽ của mình, Deepseek V3, chỉ với 6 triệu đô la chỉ sử dụng 2048 bộ xử lý đồ họa. Tuy nhiên, một cuộc điều tra sâu sắc hơn bằng cách bán phân giải cho thấy một cơ sở hạ tầng rộng lớn hơn, bao gồm khoảng 50.000 GPU phễu NVIDIA trên một số trung tâm dữ liệu. Điều này bao gồm 10.000 đơn vị H800, 10.000 H100 và GPU H20 bổ sung, không chỉ được sử dụng để đào tạo AI mà còn cho nghiên cứu và mô hình hóa tài chính. Tổng đầu tư của công ty vào các máy chủ đạt khoảng 1,6 tỷ đô la, với chi phí hoạt động ước tính khoảng 944 triệu đô la.

Là một công ty con của Quỹ phòng hộ Trung Quốc, DeepSeek hoạt động độc lập, sở hữu các trung tâm dữ liệu của mình. Sự tự chủ này cho phép đổi mới và thực hiện nhanh hơn, vì công ty tự tài trợ và không bị sa lầy bởi các quy trình quan liêu bên ngoài. Deepseek cũng thu hút tài năng hàng đầu từ các trường đại học hàng đầu Trung Quốc, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm.

Mặc dù yêu cầu chi phí đào tạo trị giá 6 triệu đô la, con số này chỉ bao gồm việc sử dụng GPU trong quá trình đào tạo trước và không bao gồm các chi phí rộng hơn như nghiên cứu, tinh chỉnh mô hình, xử lý dữ liệu hoặc chi phí cơ sở hạ tầng. Kể từ khi thành lập, Deepseek đã đầu tư hơn 500 triệu đô la vào phát triển AI, tận dụng cấu trúc nhỏ gọn của nó để thúc đẩy các đổi mới AI hiệu quả.

Hành trình của Deepseek nêu bật cách một công ty AI độc lập, được tài trợ tốt có thể thách thức những người khổng lồ trong ngành. Tuy nhiên, thành công của công ty được quy cho các khoản đầu tư đáng kể, đột phá kỹ thuật và một nhóm mạnh mẽ, thay vì "ngân sách cách mạng". Mặc dù chi phí của các đối thủ cạnh tranh cao hơn đáng kể, Deepseek đã chi 5 triệu đô la cho R1 so với 100 triệu đô la của Chatgpt4o, Deepseek vẫn là một người chơi đáng gờm trong bối cảnh AI.

DeepSeek Test Hình ảnh: Ensigame.com

Deepseek v3 Hình ảnh: Ensigame.com

Deepseek Hình ảnh: Ensigame.com

Deepseek Hình ảnh: Ensigame.com

Tin tức hàng đầu
Hơn
Copyright © 2024 yuzsb.com All rights reserved.