Hoy, la startup israelí de IA aiOla anunció el lanzamiento de un nuevo modelo de reconocimiento de voz de código abierto que es un 50% más rápido que el famoso Whisper de OpenAI.
Oficialmente denominado Whisper-Medusa, el modelo se basa en Whisper pero utiliza una novedosa arquitectura de “atención multi-cabezal” que predice muchos más tokens a la vez que la oferta de OpenAI. Su código y pesos se han publicado en Hugging Face bajo una licencia MIT que permite su uso tanto para investigación como para uso comercial.
Obtén acceso ilimitado a todos nuestros artículos y contenidos Gratis y Premium
Dale CLIC AL BOTÓN DE ABAJO