Cuando hables con un chatbot como ChatGPT, nunca debes asumir que tus conversaciones son privadas. Muchos chatbots, de forma predeterminada, utilizan sus discusiones para entrenar los modelos de IA subyacentes, pero incluso si opta por no participar en la capacitación o utiliza un chat temporal, estas conversaciones a menudo se almacenan en los servidores de la empresa durante un período de tiempo limitado. La regla general es evitar compartir con un chatbot cualquier cosa que no quieras que salga en público. (Información patentada de la empresa, secretos personales, etc.) ¿Pero qué pasa si el chatbot en cuestión ya tiene su información privada? ¿Qué pasa si ChatGPT, Gemini o Claude están felices de compartir su número de teléfono con cualquiera que lo solicite?
Ésa es la discusión con la que me topé esta semana, luego de un informe de Eileen Guo de MIT Technology Review. En el artículo, Guo revisa una serie de afirmaciones de usuarios que dicen que los chatbots han estado compartiendo información personal, como números de teléfono, cuando se les solicita. En algunos casos, los chatbots compartirían la información cuando la persona en cuestión la solicitara; en otros casos, sin embargo, fueron extraños quienes buscaron detalles. En un ejemplo, un ingeniero de software de Israel recibió un mensaje de un contacto desconocido a través de WhatsApp, solicitando ayuda con su aplicación de pago. Cuando el ingeniero preguntó cómo el extraño obtuvo su información de WhatsApp, le enviaron una captura de pantalla que muestra cómo Gemini compartió los detalles cuando se le solicitó. Posteriormente, el ingeniero encontró una única fuente en Internet que contenía su número de teléfono: una publicación de Quora de 2015.
¿Cómo obtienen los chatbots nuestra información privada?
Los chatbots como ChatGPT están entrenados con grandes cantidades de datos. Gran parte de estos datos, por supuesto, provienen de Internet. Por lo tanto, es muy posible que los sitios web que contienen su información personal (como una publicación aleatoria en un foro de una década antes) hayan terminado en el conjunto de datos de un chatbot y hayan regresado como parte de una consulta sobre su información. Incluso si no fuera parte de los datos de capacitación, los chatbots han tenido la capacidad de buscar en la web durante años. Estos modelos pueden recorrer una enorme cantidad de sitios web para devolver resultados para una solicitud y, si encuentran su información, es posible que la compartan.
El problema más profundo es que nuestra información aparece en Internet, lo sepamos o no. Es posible que tengamos información de contacto personal presente en sitios web que recordemos o no haber publicado; Los sitios web de pueblos y ciudades pueden tener nuestra información personal adjunta a registros públicos, incluso si esos resultados no suelen aparecer en la parte superior de una búsqueda típica de Google. Sin embargo, debido a que la IA es capaz de realizar inmersiones profundas en todos estos resultados web, es capaz de encontrar resultados oscuros y sacarlos a la luz, exponiendo potencialmente sus detalles.
Ahora, como explica Guo, la mayoría de los chatbots cuentan con barandillas de seguridad para evitar que hagan daño o, tal vez, también. mucho dañar. Me encontré con esto de primera mano cuando le pregunté a ChatGPT cuál era mi número de teléfono. Me dijo que no podía entregar información personal de particulares, ya que eso iría en contra de sus medidas de seguridad. Sin embargo, sí encontró dos números de teléfono de «Jake Peterson» que estaban «de cara al público», tal vez listados abiertamente en sitios web corporativos individuales. (Para que conste, ninguno de los resultados fue mi número de teléfono).
Pero estas barreras están lejos de ser perfectas. Guo destaca un caso en el que un estudiante de doctorado de la Universidad de Washington buscó la información de contacto de su amigo en Gemini. El robot regresó con la investigación de ese amigo, pero también con su número de teléfono. Más tarde, la amiga confirmó que había compartido su número de teléfono en línea como parte de un taller de tecnología, pero que nunca tuvo la intención de que fuera visible para cualquiera que lo solicitara. (Gemini no pudo encontrar o tampoco quiso compartir mi información de contacto personal, pero estuvo feliz de compartir mi cuenta X).
¿Qué opinas hasta ahora?
¿Puedes eliminar tu número de teléfono de los conjuntos de datos de los chatbots?
Desafortunadamente, no tenemos muchas buenas opciones cuando se trata de proteger nuestra privacidad de los chatbots. Hay que reconocer que OpenAI tiene un portal que le permite solicitar la eliminación de su información personal de las respuestas, pero, como señala Guo, la empresa se reserva el derecho de rechazar su solicitud por varios motivos. Anthropic solo tiene un documento de soporte que explica cómo utiliza su información, mientras que Google le permitirá solicitar la exclusión voluntaria del procesamiento de datos personales, pero solo según su jurisdicción. (La empresa denuncia específicamente a la UE y al Reino Unido en función de sus leyes de protección de datos).
Quizás, entonces, el enfoque más realista sea sacar esta información de la Internet pública tanto como sea posible. Si vive en California, puede utilizar este portal para solicitar que los intermediarios de datos eliminen su información de sus bases de datos. También puedes consultar cualquier cantidad de herramientas de eliminación de datos personales, como Incogni o DeleteMe, para intentar lograr lo mismo. Sin embargo, si bien estos pueden eliminar su información de algunos rincones de Internet, no hay mucho que pueda hacer si las empresas de inteligencia artificial ya tienen su información en sus conjuntos de datos.
La triste realidad aquí es que la tecnología de inteligencia artificial superó las regulaciones sobre privacidad personal. Si los legisladores hubieran dado un paso adelante para garantizar que todos tuviéramos la opción de excluirnos de estas prácticas de recopilación de datos, podríamos haber solucionado el problema de raíz. Pero a partir de ahora, lo mejor que podemos hacer es pedir que nuestra información sea eliminada y no utilizada y, si la situación empeora, cambiar nuestra información de contacto por completo.
