«Hay semanas de décadas y décadas en las que no pasó nada». Fue exactamente la última semana, fue una semana de décadas. VeteranoRompió su memorización en la inteligencia artificial y se sacudió fundamentalmente tanto el valle de Silicon como los mercados. Junto con Deepseek, la raza global en el campo de la inteligencia artificial, de hecho, en realidad ha comenzado. Nvidia alcanzó la mayor depreciación de una empresa en la historia, Perdido $ 590 mil millones. ¡La pérdida de Nvidia en un día es más del doble de las exportaciones anuales totales de Turquía! Las tarjetas han sido redistribuidas no solo una tecnología, sino también una herramienta de política utilizada por los países. Entonces, ¿qué pasó exactamente la semana pasada?
¿Qué es Deepseek?
Deepseek es una compañía de inteligencia artificial que desarrolla LLM basada en China (modelos de idiomas grandes). Liang Wenfeng, fundador y CEO de la compañía, es un ingeniero electrónico nacido en 1985. En 2015, Wenfeng establece un fondo de inversión llamado High-Flyer, que compra acciones utilizando algoritmos de inteligencia artificial y aún administra una cartera por valor de $ 9 mil millones hoy. En 2023, como subcompanio de High-Flyer, se implementa Deepseek. La misión de Deepseek es hacer que las tecnologías éticas de inteligencia artificial sean accesibles.
¿Qué es la revolución de Deepseek?
Si la información compartida por Deepseek es correcta, lograron desarrollar un modelo tan bueno ya que reducen el costo de capacitar el modelo a 5.8 millones de dólares, el número de GPU utilizados de 100,000 a 2,000. Además, hicieron esto con muchos menos investigadores que sus competidores y presentaron el modelo al mundo de forma gratuita.
¿Cómo logró Deepseek esto?
Deepseek es un modelo de código abierto. Es posible alcanzar los códigos de origen y los artículos técnicos. Si recuerda, se experimentó una crisis de chips global debido a los descansos en las cadenas de suministro con Covid-19 Pandema. Entonces, Estados Unidos trajo un embargo de chips a China y permitió que Nvidia vendiera solo chips de baja capacidad a China. La principal diferencia entre la H100 utilizada por las empresas en los Estados Unidos y el H800, que puede usar empresas en China, es el ancho de banda entre las GPU. Entonces, ¿cómo superó China esta importante restricción?
A diferencia de los modelos tradicionales de inteligencia artificial, Deepseek adopta el sistema de «mezcla de expertos»:
- Mientras que los modelos tradicionales siempre mantienen todos los parámetros activos, Deepseek usa solo los parámetros requeridos en un momento determinado. De esta manera, aunque OpenAI usa 1.8 billones de parámetros activos, Deepseek solo puede lograr el mismo nivel de rendimiento manteniendo solo 37 mil parámetros activos.
Además, gracias a la optimización FP8 (punto flotante de 8 bits), reduce la necesidad de memoria y cálculo en un 75 por ciento almacenando datos en formato más pequeño (como usar todos los datos, usando abreviaturas). Además, lo hace sin comprometer el resultado y proporcionar eficiencia energética. Hay muchas innovaciones pequeñas que hacen, pero estos dos métodos son críticos para proporcionar el aumento de la productividad y el rendimiento.
¿Los datos realmente van a China?
Algunos expertos no coinciden que este es el proyecto de un gobierno chino, especialmente después del proyecto Stargate de $ 500 mil millones anunciado por Trump’s OpenAI, Oracle y SoftBank, y en medio del debate de Tiktok. Algunos de ellos piensan que las capacidades de inteligencia artificial de China no deben subestimarse, y esta es una advertencia importante para compañías estadounidenses gigantes como OpenAi, Facebook y Google.
Mientras escribía este artículo, la inteligencia artificial de Estados Unidos y el líder criptográfico David Sacks dijo que había evidencia seria de que Deepseek fue entrenado con datos de OpenAI. Si se confirman estas reclamaciones, la competencia tecnológica entre Estados Unidos y China aumentará aún más y las nuevas discusiones sobre el intercambio de datos llegarán a la agenda.
¿Los datos de los usuarios de Deepseek van a China? Si usa Deepseek desde su propio sitio web o aplicación, sí, los datos van a China. Sin embargo, dado que el modelo es de código abierto, puede descargarlo a su computadora/teléfono móvil o tableta y usarlo fuera de línea sin compartir sus datos. Nuevamente, utilizando la IA de perplejidad, cuando selecciona el modelo como R1, sus datos permanecen en perplejidad, una empresa estadounidense, no en Deepseek.
Esta determinación, que se comparte en X y es muy popular, es correcta y que proporciona el pensamiento: “OpenAi, que se establece como una empresa sin fines de lucro, tiene una tarifa de $ 200 por mes, mientras que un fondo de inversión con un completamente Las ganancias para el mundo entero ofrecen inteligencia artificial gratuita una ironía.
¿Cuáles son los resultados de todos estos desarrollos?
- Aceptación tradicional «La tecnología de inteligencia artificial, especialmente las LLM, son solo las obras que las empresas con miles de millones de dólares pueden hacer». en forma de. Openai, Meta y Google también se basaron en esta aceptación de ventajas competitivas. Con Deepseek R1, esta percepción fue completamente destruida.
- Las intercambios de valores e inversores hacen la valoración de las compañías de inteligencia artificial al centrar esta admisión, y también dijeron: “Los mejores modelos necesitan más GPU. Quien tenga más acceso a GPU y dinero. Estaban adoptando la suposición. Después de que ambos fueron destruidos, la valoración de las empresas en este campo fue sometida a rekalibración. Esta es la razón principal de la depreciación de otras compañías, especialmente Nvidia. Mi idea personal es que el mercado de valores reacciona más de lo necesario. La disminución en los precios de estas tecnologías aumentará la demanda de usuarios finales e iniciativas que desarrollan productos utilizando estas tecnologías (paradoja de Jevons).
- Al final del día, Openai y otros ahora están examinando lo que Deepseek ha hecho, y aplicarán sus innovaciones a sus propios modelos y aumentarán la productividad. Después de los desarrollos del meta, sabemos que 4 «sala de guerra» y el equipo de inteligencia artificial trabajan día y noche. Esta carrera continuará aumentando la velocidad sin disminuir la velocidad.
- Incluso si tiene equipos muy grandes, tiene una fuente de mil millones de dólares; Un equipo inteligente y trabajador que es móvil con el mismo propósito sigue siendo uno de los factores que proporcionan la mayor ventaja competitiva. Deepseek nos demostró de nuevo.
- La inteligencia artificial no es solo una tecnología, sino también una herramienta de política utilizada por los países.
- Deepseek nos mostró que lo importante no es LLMS. En el punto que hemos llegado, es más crítico desarrollar interfaces con lo que se hará en la capa de aplicación. Este es un desarrollo importante y positivo para empresarios e iniciativas en países que todavía están entrando en esta carrera.
- Apple es la posición más ventajosa en esta nube de polvo. Apple, como otros, «todos lo están haciendo, yo también tengo que hacerlo». No gastó mil millones de dólares y no ingresó al negocio. No se apresuró, no entró en pánico. Usando la superioridad en el hardware y la ventaja de acceder al usuario final, la creación de valor principal se incluirá en el juego muy fuertemente cuando se cambie a aplicaciones utilizando LLM.
- El punto que se pasa por alto pero el punto principal es el punto.inteligencia artificial físicaEl arte se encuentra con la hardimina de la inteligencia de Artainh. Esto incluye robots, drones, líneas de producción, sistemas de automatización. Se sabe que China tiene ventajas muy serias en términos de producción y capacidad. En este punto, la producción de energía y las tecnologías robóticas se vuelven muy críticas. Este artículo merece un artículo en sí mismo porque incluye problemas de seguridad de la industria de defensa y el país en este campo.
Última palabra: Esta revolución abre una ventana importante de oportunidades para empresarios e iniciativas en Turquía: ya no tiene que tener miles de millones de dólares en la carrera de inteligencia artificial. Es hora de convertir la desventaja de llegar tarde a una ventaja. Todo lo que necesitamos son los equipos inteligentes y de trabajo duro, soluciones eficientes y la determinación de desarrollar prácticas innovadoras que integren esta tecnología en la vida diaria.