Beneficios | Desventajas |
---|---|
El modelo abierto se puede personalizar para su negocio. | Meta entrenó a Llama 3 en información pública, por lo que, al igual que otras IA generativas, podría crear contenido dañino o infringir las leyes de derechos de autor. |
Genere texto o imágenes, especialmente con la función Imaginar para la iteración rápida de imágenes. | En nuestras pruebas, los correos electrónicos profesionales generados por Llama 3 tendían a ser un poco vagos y confusos en comparación con los escritos por ChatGPT con GPT-3.5. |
Úselo con su proveedor de nube actual. | Al igual que con otras IA generativas, entrenar Llama 3 puede demandar mucho tiempo y recursos si planeas personalizar el modelo. |
OpenAI puede ser el nombre más conocido en lo que respecta a la IA generativa comercial, pero Meta ha logrado hacerse un lugar con éxito al abrir al público modelos de lenguajes grandes y potentes. Meta reveló su modelo de IA generativa más grande hasta el momento, Llama 3, el 18 de abril, que supera a GPT-4 en algunas pruebas de referencia de IA estándar.
¿Qué es Llama 3?
Llama 3 es un LLM creado por Meta. Se puede utilizar para crear IA generativaincluidos chatbots que pueden responder en lenguaje natural a una amplia variedad de consultas. Los casos de uso en los que se evaluó Llama 3 incluyen lluvia de ideas, escritura creativa, codificación, resumen de documentos y respuesta a preguntas con la voz de una persona o personaje específico.
El modelo completo Llama 3 viene en cuatro variantes:
- 8 mil millones de parámetros preentrenados.
- Instrucciones de 8 mil millones de parámetros afinados.
- 70 mil millones de parámetros preentrenados.
- Instrucciones de 70 mil millones de parámetros afinados.
Las capacidades de inteligencia artificial generativa de Llama 3 se pueden utilizar en un navegador o a través de funciones de IA en Facebook, Instagram, WhatsApp y Messenger de Meta. El modelo en sí se puede descargar desde Meta o desde las principales plataformas de nube empresarial.
¿Cuándo se lanzará Llama 3 y en qué plataformas?
Llama 3 se lanzó el 18 de abril en Google Cloud Vertex AI, watsonx.ai de IBM y otras grandes plataformas de alojamiento LLM. AWS siguió su ejemplo y agregó Llama 3 a Amazon Bedrock el 23 de abril. A partir del 29 de abril, Llama 3 está disponible en las siguientes plataformas:
- Ladrillos de datos.
- Cara abrazada.
- Arruinar.
- Microsoft Azure.
- Tarjeta gráfica NVIDIA NIM.
Las plataformas de hardware de AMD, AWS, Dell, Intel, NVIDIA y Qualcomm admiten Llama 3.
El 23 de julio, Meta Anunciado Llama 3.1 405B (la versión más avanzada de Llama 3 hasta ahora) y mejoras en Llama 3.1 70B y 8B.
¿Llama 3 es de código abierto?
Llama 3 es de código abierto, como lo han sido otros LLM de Meta. La creación de modelos de código abierto ha sido un diferenciador valioso para Meta. El fundador y director ejecutivo de Meta, Mark Zuckerberg, explicó su opinión sobre esta filosofía en un artículo Publicación de la sala de redacción de julio.
VER: El informe del índice de inteligencia artificial de Stanford revela 8 tendencias de la IA en los negocios Hoy. (TechRepublic)
Existe cierto debate sobre qué porcentaje del código o de los pesos de un modelo de lenguaje grande deben estar disponibles públicamente para que se considere de código abierto. Pero en lo que respecta a los fines comerciales, Meta ofrece una visión más abierta de Llama 3 que la que ofrecen sus competidores para sus LLM.
¿Llama 3 es gratis?
Llama 3 es gratuito siempre que se utilice según los términos de la licenciaEl modelo se puede descargar directamente desde Meta o utilizarse dentro de los diversos servicios de alojamiento en la nube enumerados anteriormente, aunque dichos servicios pueden tener tarifas asociadas.

¿Llama 3 es multimodal?
Llama 3 no es multimodal, lo que significa que no es capaz de comprender datos de diferentes modalidades, como video, audio o texto. Meta planea hacer que Llama 3 sea multimodal en un futuro cercano.
Mejoras de Llama 3 respecto a Llama 2
Para que Llama 3 fuera más capaz que Llama 2, Meta agregó un nuevo tokenizador para codificar el lenguaje de manera mucho más eficiente. Meta mejoró Llama 3 con atención de consultas agrupadas, un método para mejorar la eficiencia de la inferencia de modelos. El conjunto de entrenamiento de Llama 3 es siete veces más grande que el conjunto de entrenamiento utilizado para Llama 2, dijo Meta, e incluye cuatro veces más código. Meta aplicó nuevas eficiencias al preentrenamiento de Llama 3 y al ajuste fino de las instrucciones.
Dado que Llama 3 está diseñado como un modelo abierto, Meta agregó medidas de seguridad teniendo en cuenta a los desarrolladores. Una nueva medida de seguridad es Code Shield, que tiene como objetivo detectar el código inseguro que el modelo pueda producir.
¿Qué sigue para Llama 3?
Meta planea:
- Añade varios idiomas a Llama 3.
- Ampliar la ventana de contexto.
- En general, aumentar las capacidades del modelo en el futuro.
Meta está trabajando en un modelo de parámetros 400B, que puede ayudar a dar forma a la próxima generación de Llama 3. En las primeras pruebas, Llama 3 400B con ajuste de instrucciones puntuado 86,1 en la evaluación de conocimientos de MMLU (una prueba de referencia de IA), según Meta, lo que lo hace competitivo con GPT-4. Llama 400B sería el LLM más importante de Meta hasta el momento.
El lugar de Llama 3 en el competitivo panorama de la IA generativa
Llama 3 compite directamente con GPT-4 y GPT-3.5, Géminis de Google y Gemma, Mistral 7B de Mistral AI, Perplexity AI y otros LLM para uso individual o comercial para construir chatbots de IA generativa y otras herramientas. Aproximadamente una semana después de que se revelara Llama 3, Snowflake presentó su propia IA empresarial abierta con capacidades comparables, llamada Copo de nieve del Ártico.
Los crecientes requisitos de rendimiento de los LLM como Llama 3 están contribuyendo a una carrera armamentista Computadoras con inteligencia artificial que pueden ejecutar modelos al menos parcialmente en el dispositivo. Mientras tanto, las empresas de IA generativa pueden enfrentar un mayor escrutinio sobre las necesidades de computación pesada, lo que podría contribuir a empeoramiento del cambio climático.
Llama 3 frente a GPT-4
Llama 3 supera al GPT-4 de OpenAI en HumanEval, que es un punto de referencia estándar que compara la capacidad del modelo de IA para generar código con el código escrito por humanos. Llama 3 70B obtuvo una puntuación de 81,7, en comparación con Puntuación de 67 en GPT-4.
Sin embargo, GPT-4 superó a Llama 3 en la evaluación de conocimientos MMLU con una puntuación de 86,4 frente a los 79,5 de Llama 3 70B. El desempeño de Llama 3 en más pruebas se puede encontrar en Entrada del blog de Meta.
¿Debería su organización utilizar Llama 3?
Suponiendo que ya haya decidido que la IA generativa es adecuada para su negocio, la decisión de usar o no Llama 3 probablemente dependerá de la disponibilidad. Llama 3 se puede usar de forma gratuita y se puede personalizar dentro de ciertos límites, más que sus competidores.
Llama 3 puede ser más eficaz que sus rivales como GPT-4 o Claude 3 para la codificación. Sin embargo, Llama 3 tiene otros competidores en el espacio de la codificación. Por ejemplo, GitHub debutó recientemente Espacio de trabajo de copilotoque está personalizado para la codificación y puede crear código basado en indicaciones en lenguaje natural.
Llama 3 puede ser bueno para su organización si desea una familia de modelos de IA de código abierto y propósito general.