
科技巨頭Meta重磅推出了其極具突破性的開(kāi)源人工智能 (AI) 模型——Llama 4系列。這一系列模型憑借創(chuàng)新的架構(gòu)設(shè)計(jì)與強(qiáng)大的性能表現(xiàn),在人工智能領(lǐng)域掀起了新的波瀾。?
Llama 4系列首次采用了混合專家(MoE)架構(gòu)。這種架構(gòu)極大地提升了模型訓(xùn)練和回答用戶查詢時(shí)的效率,它能夠?qū)⒛P颓擅畹貏澐譃槎鄠€(gè)專注于特定任務(wù)的 “專家” 子模型,讓每個(gè)子模型各司其職,協(xié)同完成復(fù)雜的任務(wù)。?
此次發(fā)布的Llama 4 Scout堪稱性能最強(qiáng)的小尺寸模型。它擁有170億的激活參數(shù),配備16個(gè)“專家”模型,總參數(shù)量達(dá)1090億。值得一提的是,Llama 4 Scout運(yùn)行速度極快,并且原生支持多模態(tài),其多模態(tài)上下文窗口高達(dá)1000萬(wàn)+ Token。更為驚艷的是,如此強(qiáng)大的它僅需單張H100 GPU即可流暢運(yùn)行,為眾多科研人員和開(kāi)發(fā)者提供了便捷且高效的使用體驗(yàn)。?
Llama 4 Maverick同樣表現(xiàn)卓越,被譽(yù)為同級(jí)別中最佳的多模態(tài)模型。它與Llama 4 Scout 一樣擁有170億激活參數(shù),但 “專家” 模型數(shù)量增加到了128個(gè),總參數(shù)量飆升至4000億。其上下文窗口超過(guò)100萬(wàn),在多個(gè)主流基準(zhǔn)測(cè)試中,Llama 4 Maverick成功擊敗了GPT-4o和 Gemini 2.0 Flash。在推理和編碼能力方面,它與DeepSeek v3相當(dāng),然而其激活參數(shù)量卻不到后者的一半,并且能夠在單個(gè)主機(jī)上運(yùn)行,在性能與資源占用之間達(dá)到了絕佳的平衡。?
除了已經(jīng)發(fā)布的Llama 4 Scout和Llama 4 Maverick,Meta還帶來(lái)了預(yù)覽版的Llama 4 Behemoth。這一模型堪稱 Meta迄今最強(qiáng),擁有2880億激活參數(shù),16個(gè)“專家”模型,總參數(shù)量更是達(dá)到令人驚嘆的2萬(wàn)億。在多個(gè)STEM基準(zhǔn)測(cè)試中,Llama 4 Behemoth的表現(xiàn)優(yōu)于GPT-4.5、Claude Sonnet 3.7和Gemini 2.0 Pro,展現(xiàn)出了在科學(xué)、技術(shù)、工程和數(shù)學(xué)等領(lǐng)域的強(qiáng)大實(shí)力。?
所有這些模型均經(jīng)過(guò)海量未標(biāo)注的文本、圖像和視頻數(shù)據(jù)的深度訓(xùn)練,從而具備了廣泛且深入的視覺(jué)理解能力。Meta方面表示,其人工智能助手Meta AI已在40個(gè)國(guó)家更新為使用 Llama 4模型,不過(guò)目前多模態(tài)功能僅在美國(guó)以英語(yǔ)提供。








