Meta发布新一代多模型Llama 4 ssd新闻存储新闻

2025-04-07

阅读量 1641

据闪德资讯获悉，Meta发布新一代多模态模型Llama 4系列，已有2款新模型可从llama.com或Hugging Face下载，分别是Llama 4 Scout、Llama 4 Maverick。

Llama 4 Scout拥有170亿有效参数和4,000亿总参数，具有多达1,000万词元（token）上下文长度。

在多项基准测试超越Google的Gemma 3、Gemini 2.0 Flash-Lite及Mistral 3.1，并且可在单一NVIDIA H100 GPU 运行。

规模较大的Llama 4 Maverick性能上则媲美GPT-4o和Gemini 2.0 Flash，且在程序设计与推理任务中，使用的有效参数不到一半，表现与DeepSeek-V3 相当，可在单一H100 DGX 主机上运行便于部署。

Meta还表示，目前正在训练Llama 4 Behemoth，这被Meta CEO扎克伯格称为“全球性能最强的基础模型”。

Llama 4 Behemoth将拥有2,880亿有效参数，总参数达2万亿。

虽然这款模型尚未正式推出，但Meta表示，它在多项STEM基准测试中，将能超越竞争对手如GPT-4.5、Claude Sonnet 3.7 及Gemini 2.0 Pro。

Meta强调Llama 4采用MoE（Mixture of Experts Models，混合专家模型）架构，在训练和推理方面具有更高的运算效率。

Meta计划在4月29日举行的LlamaCon开发者大会，进一步探讨其AI模型和产品的未来计划。

点击此处关注，获取最新资讯！

1.本文整理自网络，如有侵权，请联系删除。

2.所刊内容仅代表作者观点，非闪德资讯立场。

请登录后评论