META PRESENTA LLAMA, MODELO DE LENGUAJE IA QUE SUPERA A GPT-3

Marcelo Calsina Callejas
1 mar 2023
2 Min. de lectura

Según los rumores, LLaMA podría superar a GPT-3 en la mayoría de las pruebas. Este avance en inteligencia artificial cambiaría el juego para los investigadores, en el cual se descubre un acceso de vanguardia en una amplia variedad de idiomas.

Meta, la empresa matriz de Facebook, ha lanzado un nuevo modelo de lenguaje denominado LLaMA (Large Language Model Meta AI), que se enfoca en la investigación de la inteligencia artificial. La empresa ha decidido lanzar LLaMA como una herramienta para investigadores y no como un sistema con el que cualquiera pueda interactuar, como ChatGPT o el nuevo bot de Bing. LLaMA está disponible en varios tamaños, incluyendo 65B, 33B, 13B y 7B, y ha sido entrenado con diferentes cantidades de tokens y textos en una veintena de idiomas diferentes.

Según Meta, LLaMA-13B supera a GPT-3 (175B) en la mayoría de las pruebas, y LLaMA-65B compite con los mejores modelos, Chinchilla70B y PaLM-540B. Sin embargo, la tasa de respuestas correctas de LLaMA sigue siendo baja, según la empresa.

El objetivo de Meta es ayudar a los investigadores a avanzar en su trabajo en el campo de la inteligencia artificial. LLaMA requiere mucha menos potencia y recursos informáticos a la hora de experimentar con nuevos enfoques, validar trabajos y explorar aplicaciones, lo que democratiza todavía más el acceso a este campo tan importante y cambiante.

A pesar de los recientes avances en los modelos lingüísticos de gran tamaño, la investigación sigue teniendo un acceso limitado a ellos debido a los recursos necesarios para entrenarlos y ejecutarlos, según Meta. Los modelos lingüísticos han avanzado en la generación de textos, la resolución de problemas matemáticos o la respuesta de preguntas de comprensión lectora, pero las restricciones de acceso que ocasionan los recursos necesarios para su entrenamiento han limitado la capacidad de los investigadores para comprender cómo funcionan.

La empresa reconoce que aún queda mucho por investigar para hacer frente a los riesgos de sesgo, comentarios tóxicos y alucinaciones en los grandes modelos lingüísticos. Al compartir el código, otros investigadores pueden probar más fácilmente nuevos enfoques para limitar o eliminar estos problemas en grandes modelos.

En definitiva, con LLaMA, Meta quiere reivindicar su presencia en la carrera de la IA y ser líder en inteligencia artificial generativa.