Chatgpt Maker soupçonne que les modèles de l'IA profonde de terre chinoise pas cher ont été construits à l'aide de données Openai - et l'ironie n'est pas perdue sur Internet

Feb 21,25

Openai soupçonne que Deepseek, un modèle d'IA chinois nettement moins cher que les homologues occidentaux, peut avoir été formé à l'aide des données d'Openai. Cette révélation, associée à la montée rapide de Deepseek, a envoyé des ondes de choc dans l'industrie de la technologie américaine, entraînant une baisse significative des cours des actions des principaux acteurs de l'IA. NVIDIA, un acteur clé de la technologie GPU cruciale pour le développement du modèle d'IA, a subi la perte la plus substantielle de l'histoire de Wall Street, avec une baisse des actions de 16,86%. Microsoft, Meta, Alphabet et Dell ont également connu des baisses considérables.

Le modèle R1 de Deepseek, basé sur l'Open-source Deepseek-V3, possède des coûts de formation nettement inférieurs (estimés à 6 millions de dollars) par rapport à des modèles occidentaux comme Chatgpt. Bien que cette réclamation soit contestée par certains, elle a soulevé des inquiétudes concernant les milliards investis par des entreprises technologiques américaines dans l'IA, des investisseurs troublants.

OpenAI et Microsoft étudient si Deepseek a violé les conditions d'utilisation d'OpenAI en utilisant son API ou en utilisant la «distillation», une technique qui extrait les données de modèles plus grands. OpenAI a reconnu que les entreprises chinoises tentent fréquemment de reproduire les modèles d'IA en tête et ont déclaré leur engagement à protéger leur propriété intellectuelle par des contre-mesures et une collaboration avec le gouvernement américain.

David Sacks, le tsar de l'IA du président Trump, a confirmé des preuves suggérant que Deepseek a utilisé la distillation pour tirer parti des modèles OpenAI. Il prévoit que les principales sociétés d'IA mettront en œuvre des mesures pour empêcher de telles pratiques à l'avenir.

La situation met en évidence une ironie importante: Openai, lui-même accusé d'utiliser des données sur Internet protégées par le droit d'auteur pour former Chatgpt, accusait désormais Deepseek de pratiques similaires. Cette hypocrisie a été largement notée, en particulier compte tenu de la déclaration précédente d'Openai à la Chambre des Lords du Royaume-Uni que la formation des modèles d'IA à la tête sans matériel protégé par le droit d'auteur est impossible. Ce poste est en outre souligné par des poursuites en cours, dont une du New York Times alléguant une utilisation illégale de son contenu et un autre de 17 auteurs revendiquant un «vol systématique». Le paysage juridique complexe entourant les données de formation de l'IA et le droit d'auteur continue d'évoluer, en particulier à la lumière d'un bureau de droit d'auteur américain de 2018 selon lequel l'art généré par l'IA n'est pas copyrical.

Deepseek est accusé d'utiliser le modèle d'Openai pour former son concurrent en utilisant la distillation. Crédit d'image: Andrey Rudakov/Bloomberg via Getty Images.

Actualité à la Une
Plus
Copyright © 2024 yuzsb.com All rights reserved.