据闪德资讯获悉,Meta发布新一代多模态模型Llama 4系列,已有2款新模型可从llama.com或Hugging Face下载,分别是Llama 4 Scout、Llama 4 Maverick。
Llama 4 Scout拥有170亿有效参数和4,000亿总参数,具有多达1,000万词元(token)上下文长度。
在多项基准测试超越Google的Gemma 3、Gemini 2.0 Flash-Lite及Mistral 3.1,并且可在单一NVIDIA H100 GPU 运行。
规模较大的Llama 4 Maverick性能上则媲美GPT-4o和Gemini 2.0 Flash,且在程序设计与推理任务中,使用的有效参数不到一半,表现与DeepSeek-V3 相当,可在单一H100 DGX 主机上运行便于部署。
Meta还表示,目前正在训练Llama 4 Behemoth,这被Meta CEO扎克伯格称为“全球性能最强的基础模型”。
Llama 4 Behemoth将拥有2,880亿有效参数,总参数达2万亿。
虽然这款模型尚未正式推出,但Meta表示,它在多项STEM基准测试中,将能超越竞争对手如GPT-4.5、Claude Sonnet 3.7 及Gemini 2.0 Pro。
Meta强调Llama 4采用MoE(Mixture of Experts Models,混合专家模型)架构,在训练和推理方面具有更高的运算效率。
Meta计划在4月29日举行的LlamaCon开发者大会,进一步探讨其AI模型和产品的未来计划。
点击此处关注,获取最新资讯!
我的评论
最新评论