Home
» Wiki
»
3 beste nieuwe functies van Meta AI Llama 4 Model
3 beste nieuwe functies van Meta AI Llama 4 Model
Begin april 2025 lanceerde Meta Llama 4 , de nieuwste serie AI-modellen die het bedrijf naar een hoger niveau moeten tillen. Elk nieuw Llama 4-model biedt aanzienlijke verbeteringen ten opzichte van zijn voorgangers. Dit zijn de belangrijkste nieuwe functies die u moet uitproberen.
3. Architectuur van Mixture of Experts (MoE)
Een van de meest opvallende kenmerken van de Llama 4-modellen is de nieuwe MoE-architectuur, een primeur voor de Llama-serie, die een andere aanpak hanteert dan voorgaande modellen. In de nieuwe architectuur wordt slechts een klein deel van de modelparameters voor elke token geactiveerd, in tegenstelling tot traditionele dichte transformermodellen zoals Llama 3 en lager, waarbij alle parameters voor elke taak worden geactiveerd.
Zo gebruikt Llama 4 Maverick bijvoorbeeld slechts 17 miljard actieve parameters van de 400 miljard, met 128 gerouteerde experts en één gedeelde expert. Llama 4 Scout, de kleinste in de serie, heeft in totaal 109 miljard parameters en activeert er met 16 experts slechts 17 miljard.
De grootste versie van het trio, Llama 4 Behemoth, gebruikt 288 miljard actieve parameters (met 16 experts) van de in totaal bijna twee biljoen parameters. Dankzij deze nieuwe architectuur worden er per taak slechts twee specialisten ingezet.
Dankzij de architectuurwijziging zijn modellen in de Llama 4-serie rekenkundig efficiënter tijdens training en inferentie. Door slechts een klein deel van de parameters in te schakelen, worden de servicekosten en de latentie verlaagd. Dankzij de MoE-architectuur kan Llama volgens Meta op één Nvidia H100 GPU draaien, een indrukwekkende prestatie gezien het aantal parameters. Hoewel er geen specifieke statistieken zijn, wordt aangenomen dat elke query naar ChatGPT meerdere Nvidia GPU's gebruikt, wat voor een grotere overhead zorgt in bijna elke meetbare statistiek.
2. Native multimodale verwerkingsmogelijkheden
Een andere belangrijke update van de Llama 4 AI-modellen is native multimodale verwerking, wat betekent dat het trio tekst en afbeeldingen tegelijkertijd kan begrijpen.
Dit is te danken aan de combinatie die in de initiële trainingsfase is uitgevoerd, waarbij tekst- en visuele tokens in een uniforme architectuur zijn geïntegreerd. Modellen worden getraind met behulp van grote hoeveelheden niet-gelabelde tekst-, beeld- en videogegevens.
Beter wordt het niet. Als u zich de Llama 3.2- upgrade van Meta herinnert , die in september 2024 werd uitgebracht, werden er een aantal nieuwe modellen geïntroduceerd (10 in totaal), waaronder 5 multimodale visiemodellen en 5 tekstmodellen. Dankzij de ingebouwde multimodale verwerkingsmogelijkheden van deze generatie hoeft het bedrijf geen aparte tekst- en visiemodellen meer uit te brengen.
Bovendien maakt Llama 4 gebruik van een verbeterde visuele encoder, waardoor modellen complexe visuele gevolgtrekkingstaken en invoer van meerdere afbeeldingen kunnen verwerken. Hierdoor zijn ze geschikt voor toepassingen die een geavanceerd begrip van tekst en afbeeldingen vereisen. Dankzij multimodale verwerking kunnen LLama 4-modellen bovendien in uiteenlopende toepassingen worden gebruikt.
1. Toonaangevend contextueel venster
De AI-modellen van Llama 4 beschikken over een ongekend contextueel venster van maximaal 10 miljoen tokens. Llama 4 Behemoth is op het moment van publicatie nog in ontwikkeling, maar Llama 4 Scout heeft een nieuwe standaard in de sector gezet met zijn ondersteuning voor maximaal 10 miljoen tokens in contextlengte. Hierdoor kunt u tekst invoeren die langer is dan 5 miljoen woorden.
Deze uitgebreide contextlengte is een aanzienlijke toename ten opzichte van de 8.000 tokens van Llama 3 toen het voor het eerst werd gelanceerd en zelfs de daaropvolgende uitbreiding naar 128.000 na de Llama 3.2-upgrade. En het is niet alleen de 10 miljoen contextlengtes van de Llama 4 Scout die interessant is; Zelfs Llama 4 Maverick is met zijn contextlengte van een miljoen een indrukwekkende prestatie.
Llama 3.2 is momenteel een van de beste AI-chatbots voor uitgebreide gesprekken. Het uitgebreide contextvenster van Llama 4 zet Llama echter op kop en overtreft daarmee het vorige contextvenster van 2 miljoen tokens van Gemini, de 200.000 van Claude 3.7 Sonnet en de 128.000 van GPT-4.5.
Dankzij het grote contextvenster kan de Llama 4-serie taken verwerken waarbij grote hoeveelheden informatie moeten worden ingevoerd. Dat grote venster is handig voor taken zoals het analyseren van lange, meerdere documenten, het gedetailleerd analyseren van grote codebases en het redeneren over grote datasets.
Het zorgt er ook voor dat Llama 4 langere gesprekken kan voeren, in tegenstelling tot eerdere Llama-modellen en modellen van andere AI-bedrijven. Als één van de redenen waarom Gemini 2.5 Pro het beste redeneermodel is, het grote contextvenster is, dan kunt u zich voorstellen hoe krachtig een 5x of 10x contextvenster is.
De 3-serie Llama-modellen van Meta behoren tot de beste LLM's op de markt. Met de release van de Llama 4-serie gaat Meta nog een stap verder. Ze richten zich niet alleen op verbeterde inferentieprestaties (dankzij het nieuwe, toonaangevende contextvenster), maar zorgen er ook voor dat de modellen zo efficiënt mogelijk zijn door gebruik te maken van een nieuwe MoE-architectuur tijdens training en inferentie.
Dankzij de native multimodale verwerkingscapaciteiten, efficiënte MoE-architectuur en het grote contextvenster is Llama 4 een open, krachtig, flexibel, gewichtgewogen AI-model dat kan concurreren met of beter kan presteren dan toonaangevende modellen voor inferentie, codering en vele andere taken.