Is Gemma 2 of Llama 3 het beste open source model?

Tijdens I/O 2024 kondigde Google zijn volgende lijn Gemma 2-modellen aan en nu brengt het bedrijf eindelijk de lichtgewicht modellen uit onder een open source-licentie. Het nieuwe model Gemma 2 27B schijnt veelbelovend te zijn en beter te presteren dan grotere modellen, zoals de Llama 3 70B en de Qwen 1.5 32B. Om deze bewering te testen, vergelijken we Gemma 2 en Llama 3: twee van de beste open source-modellen van dit moment.

Creatief schrijven

Laten we eerst eens kijken hoe goed Gemma 2 en Llama 3 zijn als het om creatief schrijven gaat. De auteur van het artikel vroeg beide modellen om een ​​kort verhaal te schrijven over de relatie tussen de maan en de zon. Beide programma's zijn geweldig, maar het Gemma 2-model van Google valt op door het boeiende proza ​​en het goede verhaal.

Is Gemma 2 of Llama 3 het beste open source model?
Is Gemma 2 of Llama 3 het beste open source model?

Llama 3 ziet er daarentegen wat saai en robotachtig uit. Google is altijd goed geweest in het genereren van tekst met Gemini-modellen en de kleinere Gemma 2 27B is daarop geen uitzondering.

Winnende optie: Gemma 2

Meertalige tests

In de volgende ronde gaan we kijken hoe goed beide modellen omgaan met niet-Engelstalige talen. Omdat Google adverteert dat Gemma 2 meerdere talen goed kan begrijpen, vergeleek de auteur het met het Llama 3-model van Meta. De auteur vroeg beide modellen om een ​​passage in het Hindi te vertalen. Zowel Gemma 2 als Llama 3 presteerden zeer goed.

Is Gemma 2 of Llama 3 het beste open source model?
Is Gemma 2 of Llama 3 het beste open source model?

De auteur probeerde ook een andere taal, Bengaals, en de modellen gaven vergelijkbare goede resultaten. Wat de Indiaanse talen betreft, kan gezegd worden dat Gemma 2 en Llama 3 goed getraind zijn in een groot corpus. De Gemma 2 27B is echter bijna 2,5 keer kleiner dan de Llama 3 70B, wat hem nog indrukwekkender maakt.

Winnende opties: Gemma 2 en Llama 3

Controleer de logica

Hoewel de Gemma 2 en Llama 3 niet de slimste modellen zijn, kunnen ze net als veel grotere modellen een aantal veelvoorkomende redeneertests uitvoeren. Bij de vorige vergelijking tussen Llama 3 en GPT-4 was het 70B-model van Meta indrukwekkend, omdat het zelfs bij zijn kleinere formaat over een behoorlijke intelligentie beschikte.

Is Gemma 2 of Llama 3 het beste open source model?
Is Gemma 2 of Llama 3 het beste open source model?

In deze ronde versloeg Llama 3 Gemma 2 met een groot puntenverschil. Lama 3 beantwoordde 2 van de 3 vragen correct, terwijl Gemma 2 moeite had om er ook maar één correct te beantwoorden. Gemma 2 is eenvoudigweg niet getraind om complexe redeneervragen op te lossen.

Llama 3 heeft daarentegen een solide basis van redeneringen, wat hoogstwaarschijnlijk kan worden afgeleid uit de gecodeerde dataset. Ondanks zijn kleine formaat – in ieder geval vergeleken met modellen met een biljoen parameters zoals GPT-4 – vertoont het een meer dan behoorlijk niveau van intelligentie. Uiteindelijk resulteert het gebruiken van meer tokens om het model te trainen in een krachtiger model.

Winnende optie: Lama 3

Volg de instructies

In de volgende ronde vroeg de auteur aan Gemma 2 en Lama 3 om 10 woorden te bedenken die eindigen op het woord “NPU”. En Llama 3 had 10/10 goede antwoorden. Daarentegen produceerde Gemma 2 slechts 7 van de 10 zinnen correct. In veel eerdere releases volgden Google-modellen, waaronder Gemini, de gebruikersinstructies niet goed. En dezelfde trend zet zich voort met Gemma 2.

Is Gemma 2 of Llama 3 het beste open source model?
Is Gemma 2 of Llama 3 het beste open source model?

Het opvolgen van gebruikersinstructies is cruciaal voor AI-modellen. Het garandeert betrouwbaarheid en genereert nauwkeurige feedback over wat u hebt opgedragen. Ook op het gebied van veiligheid zorgt het ervoor dat het model geaard blijft en er beter voldaan kan worden aan de veiligheidsprotocollen.

Winnende optie: Lama 3

Informatie vinden

Zowel Gemma 2 als Llama 3 hebben een contextlengte van 8K tokens. De auteur heeft een groot tekstblok toegevoegd, rechtstreeks afkomstig uit het boek Pride and Prejudice, met meer dan 17.000 tekens en 3.800 tokens. Zoals altijd plaatst de auteur een willekeurig citaat ergens in de tekst en vraagt ​​beide modellen om het te vinden.

Is Gemma 2 of Llama 3 het beste open source model?

Gemma 2 had de informatie snel door en merkte op dat het citaat willekeurig was ingevoegd. Ook Llama 3 vond en suggereerde dat deze bewering onjuist leek. Wat betreft het lange contextgeheugen zijn beide modellen behoorlijk sterk, hoewel ze beperkt zijn tot 8K tokens.

Houd er rekening mee dat de auteur deze test op HuggingChat (web) heeft uitgevoerd omdat meta.ai weigerde deze prompt uit te voeren, hoogstwaarschijnlijk vanwege auteursrechtelijk beschermde inhoud.

Winnende opties: Gemma 2 en Llama 3

Controleer op hallucinaties

Kleinere modellen hebben vaak last van AI-hallucinaties vanwege de beperkte trainingsgegevens. Vaak verzinnen ze dan informatie wanneer het model onbekende onderwerpen tegenkomt. Daarom bedacht de auteur de naam van zijn land om te testen of Gemma 2 en Lama 3 hallucineerden. En verrassend genoeg deden ze dat niet, wat betekent dat zowel Google als Meta een behoorlijk goede basis voor hun modellen hebben.

Is Gemma 2 of Llama 3 het beste open source model?
Is Gemma 2 of Llama 3 het beste open source model?
Is Gemma 2 of Llama 3 het beste open source model?

De auteur stelde ook nog een andere (valse) vraag om de geldigheid van de modellen te testen, maar wederom waren ze niet hallucinogeen. Overigens heeft de auteur Llama 3 getest op HuggingChat terwijl meta.ai op internet zocht naar actuele informatie over relevante onderwerpen.

Winnende opties: Gemma 2 en Llama 3

Besluiten

Hoewel het Gemma 2 27B-model van Google niet goed presteert bij redeneerproeven, is het wel geschikt voor een aantal andere taken. Het is geweldig voor creatief schrijven, ondersteunt meerdere talen, heeft een goed geheugen en is bovenal niet zo hallucinogeen als voorgaande modellen.

Llama 3 is uiteraard beter, maar is ook een aanzienlijk groter model, getraind op 70 miljard parameters. Ontwikkelaars vinden het Gemma 2 27B-model nuttig voor een breed scala aan use cases. En als kers op de taart is ook de Gemma 2 9B verkrijgbaar.

Daarnaast moeten gebruikers ook eens kijken naar de Gemini 1.5 Flash. Dit is een veel kleiner model en ondersteunt eveneens multimodale invoer. En bovendien is het ongelooflijk snel en efficiënt.

Leave a Comment

Hoe houd je Microsoft Teams de hele dag actief en beschikbaar?

Hoe houd je Microsoft Teams de hele dag actief en beschikbaar?

Leer hoe je Microsoft Teams de hele dag actief en beschikbaar houdt. Bewezen tips, tools en instellingen om de status 'Afwezig' te voorkomen, je productiviteit te verhogen en geen moment te missen tijdens je werkdag.

Hoe los je afspeelfouten van media in Microsoft Teams op in 2026?

Hoe los je afspeelfouten van media in Microsoft Teams op in 2026?

Ben je het zat dat audio-, video- en deelproblemen in Microsoft Teams je vergaderingen in 2026 verstoren? Volg onze deskundige, stapsgewijze handleiding om audio-, video- en deelproblemen snel op te lossen – zonder technische kennis. Naadloze samenwerking is binnen handbereik!

Problemen met de Microsoft Teams Mac-sleutelbos oplossen

Problemen met de Microsoft Teams Mac-sleutelbos oplossen

Heb je problemen met de sleutelhangers van Microsoft Teams op je Mac? Ontdek bewezen, stapsgewijze oplossingen voor macOS om weer probleemloos samen te werken. Snelle oplossingen vind je hier!

Het probleem oplossen dat je via een directe link deelneemt aan een vergadering in Microsoft Teams

Het probleem oplossen dat je via een directe link deelneemt aan een vergadering in Microsoft Teams

Krijg je problemen met het deelnemen aan een vergadering in Microsoft Teams? Ontdek bewezen stappen om dit op te lossen via directe links. Snelle oplossingen voor probleemloos deelnemen – geen technische kennis vereist!

Problemen met vertraging in Microsoft Teams-videoconferenties via wifi oplossen

Problemen met vertraging in Microsoft Teams-videoconferenties via wifi oplossen

Heb je last van vertraging tijdens videoconferenties in Microsoft Teams via wifi? Deze ultieme handleiding voor probleemoplossing biedt snelle oplossingen, geavanceerde tips en wifi-optimalisaties om direct weer kristalheldere videogesprekken te voeren.

Hoe u de cache van Microsoft Teams kunt wissen om prestatieproblemen op te lossen

Hoe u de cache van Microsoft Teams kunt wissen om prestatieproblemen op te lossen

Ervaart u problemen met een traag Microsoft Teams? Leer stap voor stap hoe u de cache van Microsoft Teams kunt wissen om prestatieproblemen, vertragingen en crashes op te lossen en de snelheid te verhogen op Windows, Mac, via de webbrowser en op mobiele apparaten. Snelle oplossingen die werken!

Hoe los je Microsoft Teams-fout 1200 op je telefoon op (iOS/Android)?

Hoe los je Microsoft Teams-fout 1200 op je telefoon op (iOS/Android)?

Heb je genoeg van Microsoft Teams-fout 1200 die je telefoongesprekken laat vastlopen? Ontdek snelle, stapsgewijze oplossingen voor iOS en Android, zodat je snel weer probleemloos kunt samenwerken – zonder technische kennis!

Waar bevinden zich de registerinstellingen van Microsoft Teams in Windows 11?

Waar bevinden zich de registerinstellingen van Microsoft Teams in Windows 11?

Ontdek de exacte locaties van de Microsoft Teams-registersleutels in Windows 11. Een stapsgewijze handleiding om ze te vinden, te openen en veilig aan te passen voor optimale prestaties en probleemoplossing. Essentieel voor IT-professionals en Teams-enthousiasten.

Waar vind ik de installatiemap van Microsoft Teams op mijn pc?

Waar vind ik de installatiemap van Microsoft Teams op mijn pc?

Kunt u de installatiemap van Microsoft Teams niet vinden op uw pc? Deze stapsgewijze handleiding laat u de exacte paden zien voor nieuwe en klassieke Teams-installaties, per gebruiker en per computer. Bespaar tijd bij het oplossen van problemen!

Hoe los je een aanmeldingsfout bij Microsoft Teams op Chromebooks op?

Hoe los je een aanmeldingsfout bij Microsoft Teams op Chromebooks op?

Heb je problemen met inloggen bij Microsoft Teams op je Chromebook? Ontdek stapsgewijze oplossingen om inlogproblemen snel op te lossen. Wis de cache, update apps en meer voor naadloos samenwerken. Werkt met de nieuwste Chrome OS!

Waar vind ik Microsoft Teams in Outlook? Het ontbrekende pictogram vinden

Waar vind ik Microsoft Teams in Outlook? Het ontbrekende pictogram vinden

Bent u gefrustreerd door het ontbrekende Microsoft Teams-pictogram in Outlook? Ontdek precies waar u het kunt vinden, waarom het verdwijnt en welke bewezen stappen u kunt volgen om het terug te plaatsen voor probleemloze vergaderingen. Bijgewerkt voor de nieuwste versies!

Hoe Microsoft Teams Copilot te gebruiken voor productiviteit met behulp van AI

Hoe Microsoft Teams Copilot te gebruiken voor productiviteit met behulp van AI

Ontdek hoe je Microsoft Teams Copilot kunt gebruiken om je productiviteit met AI te verhogen. Een stapsgewijze handleiding, belangrijke functies en tips om vergaderingen, chats en taken moeiteloos te transformeren. Ontgrendel vandaag nog slimmere samenwerking!

Hoe maak je een bot aan en beheer je deze in Microsoft Teams (2026)?

Hoe maak je een bot aan en beheer je deze in Microsoft Teams (2026)?

Leer hoe je een bot maakt en beheert in Microsoft Teams (2026) met deze deskundige handleiding. Van de installatie tot geavanceerd beheer: profiteer van een hogere productiviteit dankzij het nieuwste Bot Framework en de Azure-tools.

Waarom staat mijn status in Microsoft Teams vast op Afwezig?

Waarom staat mijn status in Microsoft Teams vast op Afwezig?

Ben je gefrustreerd omdat je Microsoft Teams-status vastzit op 'Afwezig'? Ontdek de belangrijkste oorzaken, zoals time-outs bij inactiviteit en energie-instellingen, plus stapsgewijze oplossingen om snel weer 'Beschikbaar' te worden. Bijgewerkt met de nieuwste Teams-functies.

Zo test je de audio en camera van Microsoft Teams vóór een gesprek.

Zo test je de audio en camera van Microsoft Teams vóór een gesprek.

Ontdek eenvoudige stappen om de audio en camera van Microsoft Teams te testen vóór een gesprek. Zorg met onze handige handleiding voor kristalhelder geluid en beeld tijdens professionele vergaderingen. Perfect voor desktop-, mobiele en webgebruikers.