Los modelos de IA generativa que impulsan ChatGPT, Copilot Gemini y otros asistentes se crearon con montañas de datos de entrenamiento. Ahora, Microsoft comenzará a utilizar interacciones con GitHub Copilot como otra fuente de esa información, a menos que usted opte específicamente por no participar en la recopilación.
GitHub, la popular plataforma de codificación propiedad de Microsoft, anunció hoy que las interacciones con GitHub Copilot se utilizarán para «entrenar y mejorar nuestros modelos de IA». GitHub Copilot es la herramienta de asistencia de código de IA integrada en Visual Studio Code, el sitio web de GitHub, la herramienta Copilot CLI (que compite con Claude Code) y otros servicios. Eso incluye datos de entrada o salida, fragmentos de código, comentarios y documentación, nombres de archivos, estructura del repositorio y otra información.
Si nunca has usado GitHub Copilot en primer lugar, esto no cambiará nada. Sin embargo, si utilizó la finalización de código en Visual Studio Code, le hizo una pregunta a Copilot en el sitio web de GitHub o utilizó otra característica de IA relacionada, sus interacciones y fragmentos de código podrían recopilarse.
Es importante destacar que la recopilación automática de datos se aplica tanto a cuentas gratuitas como a cuentas de pago. Esto incluye a los usuarios de Copilot Free, Copilot Pro y Copilot Pro+, pero no a las cuentas de Copilot Business y Copilot Enterprise.

La última actualización de Visual Studio Code es importante para el desarrollo web
No tendrás que cambiar de navegador con tanta frecuencia.
La publicación del blog explicaba que los modelos iniciales de IA para GitHub Copilot fueron «construidos utilizando una combinación de datos disponibles públicamente y muestras de código hechas a mano» (lo que no fue bien recibido por todos), y la compañía ha visto mejoras positivas al incorporar datos de los empleados de Microsoft. Ahora, GitHub espera que el servicio mejore aún más con más interacciones utilizadas como datos de entrenamiento.
GitHub dijo en el anuncio: «Este enfoque se alinea con las prácticas establecidas de la industria y mejorará el rendimiento del modelo para todos los usuarios. Al participar, ayudará a nuestros modelos a comprender mejor los flujos de trabajo de desarrollo, brindar sugerencias de patrones de código más precisas y seguras y mejorar su capacidad para ayudarlo a detectar errores potenciales antes de que lleguen a producción».
Cómo darse de baja
Puede pausar la recopilación de datos desde la página de funciones de Copilot en la configuración de su cuenta de GitHub. Después de iniciar sesión en su cuenta, hay una configuración «Permitir que GitHub use mis datos para el entrenamiento del modelo de IA» en la sección Privacidad.
Sólo necesita configurar ese menú desplegable en «Desactivado» y listo. Si tiene varias cuentas de GitHub, asegúrese de hacerlo para cada una de sus cuentas.
Fuente: Blog de GitHub