FT publicó el 29 de enero la noticia: «OpenAI dice tener evidencia de que DeepSeek utiliza sus modelos para entrenar a su competidor«. La noticia apunta a un posible robo de Propiedad Intelectual. La noticia también se ha recogido en otros medios como Forbes y The Guardian, entre otros.
El artículo enlazado de Forbes es muy interesante para conocer el estado-del-arte en la cuestión. Todo esto parece que es una carrera en torno a la obtención de una AGI (Artificial General Intelligence o Inteligencia Artificial General) y cómo crear barreras de entrada. Es importante resaltar que tan importante es la propia plataforma de inteligencia como las bases de datos e informaciones con las que esas plataformas se entrenan.
La clave de la noticia es que OpenAI dice haber sufrido un robo de PI acompañado de un uso no permitido de sus patentes.
Hasta 2023, OpenAI protegía su tecnología con Secreto Industrial. En 2023, empezó a solicitar patentes como herramienta de defensa tal y como recogen en su página de internet: «Our approach to patents«.
Por tanto, habrá que estar atentos a si las acusaciones van por robo de secretos industriales, por infracción de patentes o por ambas.
OpenAI tiene 17 familias de patentes publicadas desde principios de 2024. Es muy probable que haya más solicitudes aun no publicadas. De las 17 familias, hay 11 con patente concedida al menos en Estados Unidos. De las 17 familias, hay 4 con PCT. Las demás solo están solicitadas y/o concedidas en Estados Unidos, por el momento.
Por el momento, DeepSeek no tiene publicada ninguna patente ni solicitud de patente.
A primera vista, parece que la pelea está en los códigos IPC GF06/40/30 y GF06/40/56 que tratan del manejo de datos en el lenguaje natural (Handling Language Natural Data); más concretamente, el análisis semántico y la generación de lenguaje natural. Existen 41.161 patentes relacionadas con el análisis semántico (GF06/40/30) y 2.134 de generación de lenguaje natural (GF06/40/56).
Como dice Forbes, esto no ha hecho más que empezar.
