Microsoft acaba de presentar los nuevos modelos de IA de razonamiento PHI-4: aquí es por qué son un gran problema
Una nueva semana, un nuevo modelo de IA. Unirse a Rush está Microsoft, lanzando 3 nuevos modelos debajo el rango “phi-4”. Estos incluyen razonamiento PHI-4, razonamiento PHI-4-Rasoning Plus y Phi-4-Mini.
Además de mostrar su compromiso con los extraños esquemas de nombres que se encuentran en el mundo de la IA, estos nombres también regalan el tipo de modelo de IA.
Los modelos de razonamiento se han convertido en toda la ira recientemente. Estos están específicamente entrenados para ir más allá de la simple respuesta o generación de imágenes, participando en un enfoque más lógico para las indicaciones. A menudo están mejor equipados para verificar los hechos y problemas complejos.
La gama de razonamiento de PHI-4 se basa en la familia “modelo pequeño” de Microsoft, un proyecto iniciado por Microsoft hace aproximadamente un año.
Microsoft afirma que Phi-4-Razoning-Plus aborda el rendimiento de Deepseek R1
El objetivo aquí es construir modelos de idiomas pequeños, priorizando la eficiencia y el bajo costo. Estos difieren de los modelos de idiomas grandes, donde se les alimenta enormes cantidades de datos, lo que les permite realizar la mayoría de las tareas con inmensos detalles, pero hacerlo a un alto costo.
Esto está completamente separado para Microsoft Copilot y Copilot 365, los modelos de IA más conocidos de la marca que sirven tanto a las tareas basadas en el consumidor como al trabajo.
En cambio, los nuevos modelos de Microsoft se centran en tareas más específicas, priorizando conjuntos de datos de alta calidad y horarios de capacitación más específicos para lograr un alto rendimiento en una escala menor.
El razonamiento PHI-4 es un modelo de parámetros de 14 mil millones (los parámetros se refieren a cuánto sabe un modelo; cuanto mayor sea el número, generalmente más conoce). Fue capacitado utilizando datos web de alta calidad y se usa mejor para las aplicaciones de matemáticas, ciencias y codificación.
Phi 4-Razing-Plus está entrenado en un conjunto de datos similar, pero fue entrenado para hacer más esfuerzo para lograr una mejor precisión para tareas particulares. Microsoft afirma que PHI-4-Razoning-Plus aborda el rendimiento de Deepseek R1, a pesar de tener un parámetro mucho mayor de 671 mil millones.
¿Qué puedo hacer con los modelos de razonamiento de PHI-4?
Todos estos modelos, junto con sus informes técnicos, están disponibles en el desarrollo de la IA Sitio web abrazando cara.
Sin embargo, para la mayoría de las personas, PHI-4 no será un modelo que terminará usando. Estos tipos de modelos están diseñados para fines más avanzados, como la investigación, la codificación y la investigación científica.
Al construir un modelo que sea más pequeño y más asequible para ejecutar, Microsoft se une a Deepseek y Alibaba, centrándose en hacer que este tipo de tecnología sea más asequible en comparación con opciones como los modelos O3 de OpenAI.
Esta área de IA está avanzando rápidamente, ver que los modelos asuman tareas más complicadas con menos energía, ventanas de entrenamiento más cortas e interfaces de usuario más accesibles para que se involucren más personas.