Phi-3 de Microsoft: Un modelo de IA más pequeño y potente que supera a sus rivales más grandes

Modelos pequeños eficiente Modelos pequeños eficientes: Phi-3 de Microsoft sorprende con un rendimiento excepcional

Autor:

Actualizada:

Microsoft ha revelado su nuevo modelo de inteligencia artificial Phi-3, destacando por ser uno de los más pequeños en comparación con gigantes como GPT-4, Gemini o Llama 3, pero con un rendimiento sorprendente para su tamaño.

- Anuncio -
Modelos pequeños eficiente Modelos pequeños eficientes: Phi-3 de Microsoft sorprende con un rendimiento excepcional

Los modelos pequeños, como el Phi-3, ofrecen una solución más económica y eficiente para ejecutar tareas específicas, evitando la necesidad de la potencia computacional que requieren los modelos más grandes. A pesar de su reducido tamaño, el Phi-3 mini ha demostrado un rendimiento equiparable al de Llama 2 en varios benchmarks, y Microsoft asegura que su capacidad de respuesta es comparable a la de un modelo diez veces más grande.

Phi-3 fue entrenado mediante un enfoque innovador que implicó el uso de un «currículum» desarrollado por un modelo de lenguaje mayor. Microsoft utilizó una lista de 3000 palabras para crear libros infantiles, diseñados para enseñar a Phi-3 a partir de este contenido. Este enfoque de entrenamiento ha permitido que el rendimiento general del Phi-3 mini, medido tanto en benchmarks académicos como en pruebas internas, rivalice con modelos como Mixtral 8x7B y GPT-3.5, a pesar de ser lo suficientemente pequeño como para funcionar en un teléfono.

El modelo Phi-3 viene en tres tamaños: mini con 3.8 mil millones de parámetros, pequeño con 7 mil millones, y mediano con 14 mil millones de parámetros. En comparación, GPT-4 tiene más de un billón de parámetros, y el modelo más pequeño de Llama 3 tiene 8 mil millones.

- Anuncio -

Este avance en el desarrollo de modelos más pequeños que pueden igualar o superar a los grandes es una tendencia en crecimiento. Modelos como Llama 3 de 70B de Meta han alcanzado niveles de rendimiento cercanos a GPT-4 en algunos benchmarks, demostrando que los modelos más pequeños están encontrando nichos específicos de alto rendimiento.

Phi-3 está diseñado para funcionar en una amplia gama de dispositivos de manera rápida y eficiente, sin necesidad de conexión a internet, lo que lo convierte en una solución ideal para aplicaciones en teléfonos inteligentes, altavoces inteligentes, e incluso electrodomésticos.

La innovación de Phi-3 subraya el potencial de los modelos pequeños en el futuro de la inteligencia artificial, ofreciendo un rendimiento competitivo en dispositivos de uso cotidiano sin depender de la infraestructura en la nube.

También te puede interesar: Miraculous Corp y GameMill Entertainment lanzarán Miraculous: Paris Under Siege para consolas y computadores

NUESTRAS REDES SOCIALES
MENÚ
Logo Panorama