Microsoft anunció una nueva iteración de su modelo de inteligencia artificial (IA) de lenguaje reducido. Llamado Phi-3 Mini, este modelo puede realizar tareas como la creación de contenido y publicaciones en redes sociales utilizando cantidades más pequeñas de datos. Esto lo hace significativamente más rentable que los modelos de lenguaje grande (LLM).
Microsoft lanzó Phi-2 en diciembre, que funcionó tan bien como modelos más grandes como Llama 2 de Meta. Ahora, la compañía afirma que Phi-3 no solo funciona mejor que su versión anterior, sino que también puede proporcionar respuestas cercanas a las de un modelo de IA 10 veces más grande que él.
Modelo de IA: Phi-3 Mini
Según Microsoft, Phi-3 Mini puede superar a modelos del doble de su tamaño en una variedad de puntos de referencia que evalúan las capacidades de lenguaje, codificación y matemáticas.
Los modelos de IA más pequeños están diseñados para realizar tareas más simples, facilitando su uso por parte de empresas con recursos limitados, según Microsoft. Una empresa podría utilizar Phi-3 para resumir los puntos principales de un documento extenso, extraer información relevante y tendencias de la industria de informes de investigación de mercado, añadió Microsoft.
Phi-3 Mini tiene 3,800 millones de parámetros y está entrenado en un conjunto de datos más pequeño en relación con LLM como GPT-4 de OpenAI.
Rivales
La compañía agregó que Phi-3 Mini estará disponible inmediatamente en el catálogo de modelos de IA de Microsoft Azure, su plataforma de servicios en la nube; además, estará disponible en la plataforma de modelos de aprendizaje automático Hugging Face y en Ollama. Microsoft planea lanzar dos versiones: Phi-3 Small (7B parámetros) y Phi-3 Medium (14B parámetros).
Varios rivales de Microsoft también tienen sus propios modelos de IA pequeños, enfocados en tareas más simples. Por ejemplo, Google cuenta con Gemma 2B y 7B, que son buenos para trabajos relacionados con el idioma; mientras que Meta cuenta con Llama 3 8B, que puede usarse para chatbots y como asistencia de codificación.
Lea también: Hardware libre: motivos de su celebración anual.