La nueva IA DeepSeek envía explícitamente los datos de sus usuarios a China

En medio de los continuos temores sobre TikTok, la política de privacidad de DeepSeek expone que los datos de sus usuarios se dirigen directamente a China, lo que podría sentar las bases para un mayor escrutinio.

Febrero 2, 2025 - 11:37

0 39

La nueva IA DeepSeek envía explícitamente los datos de sus usuarios a China

La reciente medida reguladora de EE UU contra la plataforma de video propiedad de la gigante china, ByteDance, provocó la migración masiva a otra aplicación china: RedNote. Ahora, una plataforma de inteligencia artificial generativa del desarrollador chino DeepSeek está explotando en popularidad, planteando una amenaza potencial al dominio de la IA estadounidense y ofreciendo la última prueba de que moratorias como la prohibición de TikTok no impedirán que los estadounidenses utilicen servicios digitales asiáticos.

Tan popular como el buen ChatGPT

DeepSeek, un laboratorio de investigación de IA creado por un importante fondo de cobertura chino, ganó reconocimiento tras publicar su último modelo de IA generativa de código abierto que compite con las principales plataformas estadounidenses, como las desarrolladas por OpenAI. Sin embargo, para evitar las sanciones de EE UU sobre hardware y software, DeepSeek creó algunas ingeniosas soluciones al construir sus modelos. A inicios de la semana, los creadores limitaron los nuevos registros tras afirmar que la aplicación había sido invadida por un "ataque malicioso a gran escala".

Aunque DeepSeek cuenta con varios modelos de IA, algunos de los cuales pueden descargarse y ejecutarse localmente en una laptop, la mayoría de la gente accede al servicio a través de sus aplicaciones para iOS o Android o de su interfaz web. Al igual que con otros modelos de IA generativa, puedes hacerle preguntas y obtener respuestas, buscar en la web, o bien, utilizar un modelo de razonamiento para elaborar las respuestas.

Sin embargo, a medida que la gente clama por probar la plataforma de IA, la demanda pone en relieve cómo la startup china recopila los datos de los usuarios, incluidos todos los mensajes de chat, y los envía a casa. Los usuarios ya han denunciado varios ejemplos de censura por parte de DeepSeek de contenidos críticos con China o sus políticas. La compañía de medios se trasladó al alojamiento en la nube de EE UU para tratar de desviar las preocupaciones de seguridad del gobierno estadounidense, lo que en muchos sentidos contribuye a que esté enviando más datos a China que TikTok en los últimos años.

DeepSeek, que no parece haber establecido aún un departamento de comunicación ni un contacto de prensa, no devolvió una solicitud de comentarios de WIRED sobre la protección de los datos de sus usuarios y hasta qué punto da prioridad a las iniciativas de ciberseguridad.

"No debería cundir al pánico ante la IA china; la mayoría de las empresas establecen condiciones de uso de tus datos privados. Cuando utilizas sus servicios, estás haciendo 'el trabajo' por ellos, y no al revés", sugiere John Scott-Railton, investigador principal del Citizen Lab de la Universidad de Toronto, Canadá.

DeepSeek-R1 IA China

DeepSeek-R1 desafía a OpenAI o1: así es el nuevo modelo de IA chino que entusiasma a expertos en EE UU

El algoritmo creado por la startup china DeepSeek tiene un rendimiento similar al demostrado por el sistema más avanzado de OpenAI en la resolución de problemas matemáticos, químicos y de codificación.

Lo que DeepSeek recopila de ti

Para que quede claro, DeepSeek sí envía tus datos a China. Queda estipulado en la política de privacidad en inglés, que explica cómo es que la empresa maneja los datos de los usuarios: "Almacenamos la información que recopilamos en servidores seguros ubicados en la República Popular China".

En otras palabras, todas las conversaciones y preguntas que envías a DeepSeek, junto con las respuestas que genera, están siendo enviadas a China o pueden serlo. Las políticas de DeepSeek también describen la información que recopila sobre ti, que se divide en tres grandes categorías: información que tú compartes con DeepSeek, información que recopila automáticamente y datos que puede obtener de otras fuentes.

La primera de estas áreas incluye la "información del usuario", una categoría amplia que probablemente abarque tus conversaciones con DeepSeek a través de su aplicación o sitio web. "Podemos recopilar las entradas de texto o audio, solicitudes, archivos cargados, comentarios, historial de chat u otro contenido que se proporcione a nuestro modelo y servicios", reza la política de privacidad. Es posible eliminar el historial de chat. Para hacerlo, dirígete a la barra de navegación de la izquierda, toca el nombre de tu cuenta en la parte inferior del menú para abrir los ajustes y, a continuación, haz clic en "Eliminar todos los chats".

Esta recopilación es similar a la de otras plataformas de IA generativa que aceptan las indicaciones de los usuarios para responder a preguntas. Por ejemplo, ChatGPT de OpenAI es objeto de múltiples críticas por su recopilación de datos, incluso cuando la empresa ha aumentado las alternativas para eliminar la información almacenada. Independientemente de este tipo de protecciones, los defensores de la privacidad insisten en que no se debe revelar ninguna información sensible o personal a los robots de chat de IA.

"Yo no introduciría datos personales o privados en ningún asistente de IA de este tipo", afirma Lukasz Olejnik, investigador y consultor independiente, afiliado al King's College London Institute for AI. Sin embargo, Olejnik señala que si instalas modelos como los de DeepSeek localmente y los ejecutas en tu computadora, puedes interactuar con ellos de forma privada sin que tus datos vayan a parar a la empresa que los ha creado. Además, Perplexity, la empresa de búsqueda de inteligencia artificial, declara que ha añadido DeepSeek a sus plataformas, pero asegura que aloja el modelo en centros de datos de EE UU y la Unión Europea.

Otra información personal que va a parar a DeepSeek incluye los datos que utilizas para configurar tu cuenta: dirección de correo electrónico, número de teléfono, fecha de nacimiento, nombre de usuario, etc. Asimismo, si te pones en contacto con la empresa, estarás compartiendo información con ella.

Bart Willemsen, vicepresidente analista especializado en privacidad internacional de Gartner, afirma que, por lo general, la construcción y el funcionamiento de los modelos generativos de IA no son transparentes para los consumidores y otros colectivos. La gente no sabe exactamente cómo funcionan ni los datos exactos sobre los que se han construido. Para los particulares, DeepSeek es en gran medida gratuito, aunque tiene costos para los desarrolladores que utilizan sus API. "¿Con qué pagamos? Con datos, conocimientos, contenidos, información", expresa Willemsen.

Fotografía de una central de energía geotérmica en Islandia

Las Big Tech ansían la energía geotérmica para sus centros de datos

De Meta a Google, las gigantes desarrolladoras de inteligencia artificial están a la caza de nuevas formas de energía para alimentar sus centros de datos.

Sin que lo notes

Como ocurre con todas las plataformas digitales, desde los sitios web a las aplicaciones, también puede haber una gran cantidad de datos que se recopilan de forma automática y silenciosa cuando se utilizan los servicios. DeepSeek recopilará información sobre el dispositivo que se utiliza, el sistema operativo, la dirección IP e información como "informes de accidentes". También puede registrar los "patrones o ritmos de pulsación de teclas", un tipo de datos que se recogen en el software creado para lenguajes basados en caracteres. Además, si adquieres los servicios premium de DeepSeek, la plataforma recopilará esa información. También utiliza cookies y otras tecnologías de seguimiento para "medir y analizar el uso de sus servicios".

Un análisis de la actividad subyacente del sitio web de DeepSeek realizado por WIRED muestra que la empresa también parece enviar datos al gigante tecnológico chino Baidu, posiblemente con fines de análisis web, así como a Volces, una empresa china de infraestructuras de internet

La última categoría de información que DeepSeek se reserva el derecho de recopilar los datos de otras fuentes. Por ejemplo, si se crea una cuenta en DeepSeek utilizando el inicio de sesión de Google o Apple, DeepSeek recibirá información de esas empresas. Los anunciantes también comparten información con DeepSeek: "Esto puede incluir identificadores para publicidad, direcciones de correo electrónico y números de teléfono con código hash, e identificadores de cookies, que utilizamos para ayudar a establecer correspondencias entre el usuario y sus acciones fuera del servicio", recitan las políticas.

Dos años de ChatGPT: Reflexiones sobre la fiebre tecnológica.

Dos años de ChatGPT: Reflexiones sobre la fiebre tecnológica

En esta entrega de ‘PROMPTING’, la columna de WIRED en Español dedicada a explorar los alcances de la inteligencia artificial, reflexionaremos sobre qué nos ha dado y qué nos ha quedado a deber ChatGPT a dos años de nacimiento.

Cómo utiliza la información DeepSeek

Es posible que la base internacional de usuarios de DeepSeek envíe enormes volúmenes de datos a China, pero la empresa sigue teniendo poder sobre el uso que hace de la información. La política de privacidad de DeepSeek esclarece que la empresa utilizará los datos de formas típicas: mantener su servicio en funcionamiento, hacer cumplir los términos y condiciones y realizar mejoras.

Sin embargo, la política de privacidad también sugiere que se pueden aprovechar las sugerencias de los usuarios para desarrollar nuevos modelos. "La empresa revisará, mejorará y desarrollará el servicio mediante el seguimiento de las interacciones y el uso de los dispositivos; el análisis de cómo lo utiliza la gente y la formación de nuestra tecnología", puntualizan los términos de DeepSeek.

Igualmente, la compañía empleará la información para "cumplir con sus obligaciones legales", una cláusula general que muchas empresas incluyen en sus políticas. La política de DeepSeek determina que su "grupo corporativo" puede acceder a los datos y que compartirá la información con los organismos encargados de hacer cumplir la ley, las autoridades públicas, etc., cuando sea necesario.

Aunque todas las empresas tienen obligaciones legales, las que tienen su sede en China tienen responsabilidades notables. En la última década, las autoridades chinas han aprobado una serie de leyes de ciberseguridad y privacidad destinadas a que los funcionarios del Estado exijan datos a las gigantes tecnológicas. En 2017, una ley dictó que las organizaciones y los ciudadanos deben "cooperar con los esfuerzos de inteligencia nacional". Estas leyes, junto con las crecientes tensiones comerciales entre Estados Unidos y China y otros factores geopolíticos, alimentaron los temores de seguridad sobre TikTok. Los partidarios de la prohibición de TikTok argumentaban que la aplicación recopilaba grandes cantidades de datos y los enviaba a China, y que también se utilizaba para difundir propaganda china. La red social propiedad de ByteDance ha negado las acusaciones. Mientras tanto, varios usuarios de DeepSeek señalan que la plataforma no ofrece respuestas a preguntas sobre la masacre de la plaza de Tiananmen de 1989, y que responde a algunas preguntas de forma que suenan a propaganda.

Willemsen afianza que, en comparación con los usuarios de una plataforma de redes sociales como TikTok, las personas que envían mensajes con un sistema de IA generativa participan "más activamente" y el contenido puede parecer más personal. Así, cualquier influencia podría ser mayor: "Los riesgos de alteración subliminal del contenido, la dirección de la conversación y la participación activa deberían suscitar más preocupación, sobre todo teniendo en cuenta que el funcionamiento interno del modelo es ampliamente desconocido. No se han investigado sus umbrales, fronteras, controles, normas de censura e intenciones y el hecho de que ya es tan popular en su fase inicial".

Olejnik concluye que, aunque la prohibición de TikTok fue una situación concreta, los legisladores estadounidenses o de otros países podrían volver a actuar bajo una premisa similar: "No podemos descartar que en 2025 se produzca una expansión: acciones directas contra las empresas de IA. Y la recopilación de datos puede volver a ser nombrada como la razón principal".

Fuente: XWired