Llama 4 od Meta: Nowa generacja flagowych modeli AI

Meta wypuściła nową kolekcję modeli AI, Llama 4. W skład tej rodziny wchodzą cztery nowe modele: Llama 4 Scout, Llama 4 Maverick i Llama 4 Behemoth. Wszystkie modele Llama 4 zostały wytrenowane na „dużych ilościach nieoznakowanych danych tekstowych, obrazowych i wideo”, aby zapewnić im „szerokie wizualne zrozumienie”.

Architektura Llama 4: Mieszanka Ekspertów (MoE)

Meta twierdzi, że Llama 4 to pierwsza kohorta modeli wykorzystujących architekturę Mixture of Experts (MoE). Ta architektura jest bardziej efektywna obliczeniowo podczas treningu i odpowiadania na zapytania. Modele MoE dzielą zadania przetwarzania danych na podzadania, a następnie delegują je do mniejszych, wyspecjalizowanych „ekspertów”. Na przykład, Maverick ma 400 miliardów parametrów ogółem, ale tylko 17 miliardów aktywnych parametrów rozłożonych na 128 „ekspertów”.

Modele Llama 4: Scout, Maverick i Behemoth

Llama 4 Scout: Posiada 17 miliardów aktywnych parametrów, 16 ekspertów i 109 miliardów parametrów ogółem.
Llama 4 Maverick: Meta twierdzi, że jest najlepszy do „ogólnych zastosowań asystenta i czatu”, takich jak kreatywne pisanie. W wewnętrznych testach Meta, Maverick przewyższył modele takie jak GPT-4.0 Open AI i Gemini 2.0 Google w niektórych testach porównawczych kodowania, rozumowania, wielojęzyczności, długiego kontekstu i obrazu.
Llama 4 Behemoth: Wymaga jeszcze mocniejszego sprzętu. Według firmy, Behemoth ma 288 miliardów aktywnych parametrów, 16 ekspertów i prawie dwa biliony parametrów ogółem. Wewnętrzne testy porównawcze Meta pokazują, że Behemoth przewyższa GPT-4.5, Claude 3.7 Sonnet i Gemini 2.0 Pro (ale nie 2.5 Pro) w kilku ocenach mierzących umiejętności STEM, takie jak rozwiązywanie problemów matematycznych.

Porównanie z Innymi Modelami

Maverick dorównuje lub przewyższa modele takie jak GPT-4.0 Open AI i Gemini 2.0 Google w niektórych testach, ale nie dorównuje nowszym modelom, takim jak Gemini 2.5 Pro, Claude 3.7 Sonnet i GPT-4.5. Behemoth wypada obiecująco w porównaniach z innymi modelami, ale żaden z modeli Llama 4 nie jest modelem „rozumującym” w stylu 01 i 03-mini Open AI.

Dostępność i Licencjonowanie

Scout i Maverick są publicznie dostępne na Llama.com i od partnerów Meta, w tym platformy dla deweloperów AI Hugging Face, natomiast Behemoth jest wciąż w trakcie szkolenia. Niektórzy deweloperzy mogą mieć zastrzeżenia do licencji Llama 4. Użytkownicy i firmy „mające siedzibę” lub „główne miejsce prowadzenia działalności” w UE nie mogą używać ani dystrybuować modeli, prawdopodobnie ze względu na wymogi zarządzania nałożone przez unijne przepisy dotyczące AI i prywatności danych.

Podsumowanie

Llama 4 od Meta to obiecująca nowa rodzina modeli AI, która oferuje ulepszenia w architekturze, wydajności i możliwościach. Modele te mają potencjał, aby stać się ważnym graczem w dziedzinie sztucznej inteligencji, ale ograniczenia licencyjne mogą wpłynąć na ich powszechne przyjęcie.