Meta Llama 4 新參上:導入 MOE,引領多模態 AI 新浪潮

Posted by

臉書的母公司 Meta ,向來在近年 AI 市場發展可說是推手要角之一,Meta 公司日前發表其最新一代大型語言模型系列 ,稱為 Llama 4。其 AI 家族的核心成員,包括輕量級的 Llama 4 Scout、高效能的 Llama 4 Maverick,以及正在開發中的巨型模型 Llama 4 Behemoth,共同展現了 Meta 在模型規模、效能、效率及多模態能力上的全面佈局,而實際測試和應用的效果,市場上也有不同的聲音。

Llama 4 家族:滿足多元需求的模型陣容

Llama 4 Scout:輕巧靈活,效能卓越
作為系列中的入門級模型,Llama 4 Scout 被設計為高度輕量化,僅需單一 Nvidia H100 GPU 即可運行,大幅降低了部署門檻。其驚人的 1000 萬 token 上下文規格,意味著它能處理極長的文本輸入,理解複雜的上下文關係。更令人矚目的是,Scout 在多項基準測試中展現出超越 Google Gemma 3 和 Mistral 3.1 等同級競爭對手的實力,證明了其在輕量級模型中的領先地位,特別適合需要快速反應和較低資源需求的應用場景。

Llama 4 Maverick:性能強悍,資源利用高效率
Maverick 定位為系列中的主力模型,根據  Meta 官方資料,其在程式撰寫生成和複雜推理任務上的表現,已達到與 OpenAI GPT-4o 和 DeepSeek-V3 等頂級模型類似的表現。Maverick 的關鍵優勢在於其卓越的效率在達成同等性能的同時,使用的活躍參數數量卻相對較少。這得益於其採用的 專家混合 (Mixture of Experts, MoE架構,顯示了 Meta 在模型最佳化和資源效率方面的努力。不過儘管就測試的成績看起來是不錯,但也有人實際使用時覺得不如其他 AI 模型的程式開發能力,這點仍有待商榷

Llama 4 Behemoth:挑戰極限,劍指未來
Meta 同時揭露了正在積極開發中的 Llama 4 Behemoth,這款模型的規模堪稱龐大,擁有高達 2880 億個活躍參數,總參數數量更是達到驚人的 2 兆。 Meta 對外指出,Behemoth 的目標是在科學、技術、工程和數學 (STEM) 相關的基準測試中,超越如 GPT-4.5 和 Claude Sonnet 3.7 (或同等級) 的先進 AI 模型,既定目標當然是追求 AI 能力極限,以及處理超複雜的問題。

核心技術突破:MoE 架構與多模態整合

Llama 4 系列被矚目之處,在於其採用的核心技術:

專家混合 (Mixture of Experts, MoE) 架構: MoE 並非啟用整個龐大的模型來處理所有任務,而是將模型劃分為多個「專家」子網路,每個專家擅長處理特定類型的任務或數據。當接收到輸入時,一個輕量級的「路由器」會判斷哪些專家最適合處理該任務,並僅啟用這些專家。這種機制大幅降低了單次推理所需的計算量,提高了模型的反應速度和能源效率,使得像 Maverick 這樣的大型模型也能實現高效率,不會被原本龐大的架構拖累效率。

原生多模態能力: Llama 4 從設計之初就整合了處理多種資料格式的能力,包括文字、影像、音訊和影片。這使其不僅能理解文本指令,還能看懂圖片內容、聽懂語音、甚至分析影片。這種多模態整合,將帶來更自然、更直觀的人機互動體驗,例如用戶可以直接問清楚圖片中的細節,或讓 AI 比過往更好地對一段影片的核心內容做精彩的結論整理。

戰略佈局:深度整合 Meta 生態系,提升用戶體驗

Meta 計劃將 Llama 4 的強大能力深度整合到旗下龐大的產品生態系中。未來的 Meta AI 助理,無論是在 WhatsApp、Messenger、Instagram 或是 Facebook 上,都將導入 Llama 4 來協同使用,提供更智慧、更個人化的服務。此外,Meta 正積極投入 AI 語音功能的研發,目標是創造出能夠進行流暢、自然雙向對話的語音助理,讓使用者能以更接近人與人溝通的方式與 AI 互動。

「開放」策略下的商業考量:開源授權引發討論

儘管 Meta 將 Llama 4 系列標榜為「開源」,旨在推動 AI 社群的發展與創新,但其授權條款中包含了一項重要的限制:對於每月活躍用戶超過 7 億的大型商業實體,若要將 Llama 4 用於商業用途,需要與 Meta 另行協商授權。這項條款在維持模型對學術界、新創公司和中小型企業開放性的同時,也為 Meta 保留了向大型企業客戶收取授權費用的空間。此舉引發了社群對於「何謂真正開源」的討論,但也反映了 Meta 在推動技術普及與維持商業利益之間的平衡策略。

Llama 4 開啟 AI 新篇章

Meta Llama 4 系列的推出,無疑是人工智慧領域的一大步。它不僅在模型規模和性能上樹立了新的標竿,更透過 MoE 架構和多模態整合,在提升資源效率和互動自然性方面取得了顯著進展。隨著 Llama 4 逐步整合至 Meta 的各項服務,以及其在 AI 社群的潛在影響力,各位不妨多參與測試看看吧。

延伸閱讀:

The Llama 4 herd: The beginning of a new era of natively multimodal AI innovation

歡迎留下您的想法與意見: