El fabricante de chatgpt sospecha que se construyeron los modelos de AI profundos y baratos de China utilizando datos de OpenAI, y la ironía no se pierde en Internet

Feb 21,25

Operai sospecha que Deepseek, un modelo de IA chino significativamente más barato que las contrapartes occidentales, puede haber sido entrenado utilizando los datos de OpenAI. Esta revelación, junto con el rápido aumento de la popularidad de Deepseek, envió ondas de choque a través de la industria tecnológica de los EE. UU., Causando una caída significativa en los precios de las acciones de los principales jugadores de IA. NVIDIA, un jugador clave en tecnología GPU crucial para el desarrollo del modelo de IA, sufrió la pérdida más sustancial en la historia de Wall Street, con una caída de acciones del 16.86%. Microsoft, Meta, Alphabet y Dell también experimentaron una disminución considerable.

El modelo R1 de Deepseek, basado en el Deepseek-V3 de código abierto, cuenta con costos de capacitación significativamente más bajos (estimados en $ 6 millones) en comparación con modelos occidentales como ChatGPT. Si bien algunos lo disputan, algunos han planteado preocupaciones sobre los miles de millones invertidos por las compañías tecnológicas estadounidenses en la IA, los inversores inquietantes.

Operai y Microsoft están investigando si Deepseek violó los términos de servicio de OpenAI utilizando su API o empleando "destilación", una técnica que extrae datos de modelos más grandes. Openai reconoció que las empresas chinas con frecuencia intentan replicar modelos de IA de EE. UU. Y declararon su compromiso de proteger su propiedad intelectual a través de contramedidas y colaboración con el gobierno de los Estados Unidos.

David Sacks, AI Czar del presidente Trump, confirmó la evidencia que sugiere que Deepseek usó la destilación para aprovechar los modelos OpenAI. Anticipa que las principales compañías de IA implementarán medidas para evitar tales prácticas en el futuro.

La situación destaca una ironía significativa: OpenAi, acusada de usar datos de Internet con derechos de autor para capacitar a ChatGPT, ahora acusa a un gransejo de prácticas similares. Esta hipocresía se ha observado ampliamente, especialmente considerando la declaración anterior de OpenAi a la Cámara de los Lores del Reino Unido de que capacitar a los principales modelos de IA sin material con derechos de autor es imposible. Esta posición está subrayada por las demandas en curso, incluida una del New York Times alegando un uso ilegal de su contenido y otro de 17 autores que reclaman "robo sistemático". El complejo paisaje legal que rodea los datos de capacitación de IA y los derechos de autor continúa evolucionando, particularmente a la luz de un fallo de la Oficina de Derechos de Autor de los Estados Unidos de 2018 de que el arte generado por IA no es con derechos de autor.

Deepseek está acusado de usar el modelo de OpenAI para capacitar a su competidor utilizando la destilación. Crédito de la imagen: Andrey Rudakov/Bloomberg a través de Getty Images.

Las noticias más importantes
Más
Copyright © 2024 yuzsb.com All rights reserved.