DeepSeek AI: Không giá cả phải chăng, chi phí 1,6 tỷ đô la để phát triển
Deepseek, một công ty khởi nghiệp nổi tiếng của Trung Quốc, đã tạo ra những làn sóng đáng kể trong ngành công nghiệp AI với chatbot mới nhất của mình, nơi tự hào về phần giới thiệu độc đáo: "Xin chào, tôi được tạo ra để bạn có thể hỏi bất cứ điều gì và nhận được câu trả lời thậm chí có thể làm bạn ngạc nhiên." Tuyên bố táo bạo này phản ánh các công nghệ sáng tạo đằng sau các mô hình AI của Deepseek, đã góp phần làm giảm giá cổ phiếu lớn nhất của Nvidia do lợi thế cạnh tranh của họ trên thị trường.
Các tính năng nổi bật của AI của Deepseek bao gồm:
- Dự đoán đa điểm (MTP) : Không giống như các mô hình truyền thống dự đoán một từ tại một thời điểm, mô hình của Deepseek dự báo đồng thời nhiều từ, tăng cường cả độ chính xác và hiệu quả bằng cách phân tích các phần khác nhau của câu.
- Hỗn hợp các chuyên gia (MOE) : Kiến trúc này tận dụng 256 mạng lưới thần kinh, với tám mạng được kích hoạt cho mỗi nhiệm vụ xử lý mã thông báo, tăng tốc độ đào tạo AI và cải thiện hiệu suất.
- Sự chú ý tiềm ẩn đa đầu (MLA) : Cơ chế này tập trung vào các phần quan trọng của câu, liên tục trích xuất các chi tiết chính để giảm thiểu cơ hội thiếu thông tin quan trọng, do đó nắm bắt dữ liệu sắc thái một cách hiệu quả.
Deepseek tuyên bố đã đào tạo mạng lưới thần kinh mạnh mẽ của mình, Deepseek V3, chỉ với 6 triệu đô la chỉ sử dụng 2048 bộ xử lý đồ họa. Tuy nhiên, một cuộc điều tra sâu sắc hơn bằng cách bán phân giải cho thấy một cơ sở hạ tầng rộng lớn hơn, bao gồm khoảng 50.000 GPU phễu NVIDIA trên một số trung tâm dữ liệu. Điều này bao gồm 10.000 đơn vị H800, 10.000 H100 và GPU H20 bổ sung, không chỉ được sử dụng để đào tạo AI mà còn cho nghiên cứu và mô hình hóa tài chính. Tổng đầu tư của công ty vào các máy chủ đạt khoảng 1,6 tỷ đô la, với chi phí hoạt động ước tính khoảng 944 triệu đô la.
Là một công ty con của Quỹ phòng hộ Trung Quốc, DeepSeek hoạt động độc lập, sở hữu các trung tâm dữ liệu của mình. Sự tự chủ này cho phép đổi mới và thực hiện nhanh hơn, vì công ty tự tài trợ và không bị sa lầy bởi các quy trình quan liêu bên ngoài. Deepseek cũng thu hút tài năng hàng đầu từ các trường đại học hàng đầu Trung Quốc, với một số nhà nghiên cứu kiếm được hơn 1,3 triệu đô la hàng năm.
Mặc dù yêu cầu chi phí đào tạo trị giá 6 triệu đô la, con số này chỉ bao gồm việc sử dụng GPU trong quá trình đào tạo trước và không bao gồm các chi phí rộng hơn như nghiên cứu, tinh chỉnh mô hình, xử lý dữ liệu hoặc chi phí cơ sở hạ tầng. Kể từ khi thành lập, Deepseek đã đầu tư hơn 500 triệu đô la vào phát triển AI, tận dụng cấu trúc nhỏ gọn của nó để thúc đẩy các đổi mới AI hiệu quả.
Hành trình của Deepseek nêu bật cách một công ty AI độc lập, được tài trợ tốt có thể thách thức những người khổng lồ trong ngành. Tuy nhiên, thành công của công ty được quy cho các khoản đầu tư đáng kể, đột phá kỹ thuật và một nhóm mạnh mẽ, thay vì "ngân sách cách mạng". Mặc dù chi phí của các đối thủ cạnh tranh cao hơn đáng kể, Deepseek đã chi 5 triệu đô la cho R1 so với 100 triệu đô la của Chatgpt4o, Deepseek vẫn là một người chơi đáng gờm trong bối cảnh AI.
Hình ảnh: Ensigame.com
Hình ảnh: Ensigame.com
Hình ảnh: Ensigame.com
Hình ảnh: Ensigame.com
-
Apr 15,25"The Last of Us Season 2: Ngày phát hành và hướng dẫn phát trực tuyến" Khi một chương trình HBO Primetime chào tạm biệt (Tạm biệt, Lotus White), một người háo hức khác bước vào ánh đèn sân khấu. Hai năm sau lần ra mắt cuối cùng của chúng tôi trên Max, bản chuyển thể trò chơi video được đánh giá cao này có sự tham gia của Pedro Pascal và Bella Ramsey đang chuẩn bị cho lần thứ hai được mong đợi
-
Jan 22,25Vương quốc Hearts 4 sẽ khởi động lại bộ truyện Người tạo ra Kingdom Hearts Tetsuya Nomura gần đây đã bóng gió về một sự thay đổi quan trọng của bộ truyện với phần chính thứ tư sắp tới. Bài viết này đi sâu vào những tiết lộ của ông về chương mới quan trọng này. Nomura gợi ý về phần kết của loạt phim với Kingdom Hearts 4 Kingdom Hearts 4: Một câu chuyện Reset,
-
Jan 20,25'Dungeons of Dreadrock 2' được công bố, ra mắt trên Nintendo Switch vào tháng 11 với các phiên bản di động và PC tiếp theo Khoảng hai năm rưỡi trước, chúng tôi đã bị thu hút bởi trình thu thập thông tin trong ngục tối thú vị, Dungeons of Dreadrock, được phát triển bởi Christoph Minnameier. Trò chơi góc nhìn từ trên xuống này gợi nhớ đến những tác phẩm kinh điển như Dungeon Master và Eye of the Beholder, mang đến trải nghiệm giải câu đố độc đáo.
-
Dec 10,24Cosplay Marvel nổi lên: Mohg của Elden Ring gây ấn tượng Một bộ cosplay Mohg tuyệt đẹp, cực kỳ giống trùm Elden Ring, đã được chia sẻ trên mạng, làm say lòng cộng đồng game thủ. Mohg, Chúa tể Máu, một tên trùm Á thần quan trọng trong việc tiếp cận rDLC Shadow of the Erdtree mới nổi, đã có được rsự nổi bật mới. Elden Ring, một chiến thắng của FromSoftware rđã được đưa vào