Tecnología

Microsoft presento nuevo modelo de IA: Phi-3 Mini

Varios rivales de Microsoft también tienen sus propios modelos de IA pequeños, enfocados en tareas más simples.

Microsoft anunció una nueva iteración de su modelo de inteligencia artificial (IA) de lenguaje reducido. Llamado Phi-3 Mini, este modelo puede realizar tareas como la creación de contenido y publicaciones en redes sociales utilizando cantidades más pequeñas de datos. Esto lo hace significativamente más rentable que los modelos de lenguaje grande (LLM).

Microsoft lanzó Phi-2 en diciembre, que funcionó tan bien como modelos más grandes como Llama 2 de Meta. Ahora, la compañía afirma que Phi-3 no solo funciona mejor que su versión anterior, sino que también puede proporcionar respuestas cercanas a las de un modelo de IA 10 veces más grande que él.

Modelo de IA: Phi-3 Mini

Según Microsoft, Phi-3 Mini puede superar a modelos del doble de su tamaño en una variedad de puntos de referencia que evalúan las capacidades de lenguaje, codificación y matemáticas.

Los modelos de IA más pequeños están diseñados para realizar tareas más simples, facilitando su uso por parte de empresas con recursos limitados, según Microsoft. Una empresa podría utilizar Phi-3 para resumir los puntos principales de un documento extenso, extraer información relevante y tendencias de la industria de informes de investigación de mercado, añadió Microsoft.

Phi-3 Mini tiene 3,800 millones de parámetros y está entrenado en un conjunto de datos más pequeño en relación con LLM como GPT-4 de OpenAI.

Rivales

La compañía agregó que Phi-3 Mini estará disponible inmediatamente en el catálogo de modelos de IA de Microsoft Azure, su plataforma de servicios en la nube; además, estará disponible en la plataforma de modelos de aprendizaje automático Hugging Face y en Ollama. Microsoft planea lanzar dos versiones: Phi-3 Small (7B parámetros) y Phi-3 Medium (14B parámetros).

Varios rivales de Microsoft también tienen sus propios modelos de IA pequeños, enfocados en tareas más simples. Por ejemplo, Google cuenta con Gemma 2B y 7B, que son buenos para trabajos relacionados con el idioma; mientras que Meta cuenta con Llama 3 8B, que puede usarse para chatbots y como asistencia de codificación.

Lea también: Hardware libre: motivos de su celebración anual.

Contenido Patrocinado

Lo Último