Google beweert dat Gemini 2.5 beter presteert dan de beste modellen van OpenAI, DeepSeek en andere AI-techgiganten

Google heeft zojuist Gemini 2.5 geïntroduceerd, dat het bedrijf zijn ‘slimste AI-model tot nu toe’ noemt. De eerste versie van het model was de Gemini 2.5 Pro, die in veel tests indrukwekkende scores behaalde.

Google beweert dat Gemini 2.5 beter presteert dan de beste modellen van OpenAI, DeepSeek en andere AI-techgiganten

Gemini 2.5 Pro is nu beschikbaar via Google AI Studio en in de Gemini-app als u een Gemini Advanced- gebruiker bent . De Gemini 2.5 Pro zal in de nabije toekomst ook via Vertex AI verkrijgbaar zijn.

Google heeft op dit moment nog geen prijzen bekendgemaakt voor de Gemini 2.5 Pro of andere Gemini 2.5-modellen.

Alle modellen die Gemini 2.5 gebruiken, zijn 'denkmodellen'. Dat wil zeggen dat ze het denkproces kunnen verwerken voordat ze een reactie genereren. Deze ‘redeneermodellen’ zijn de volgende grote stap in de AI-wereld, omdat ze complexere en vaak nauwkeurigere antwoorden genereren.

"Nu, met Gemini 2.5, hebben we een nieuw prestatieniveau bereikt door een aanzienlijk verbeterd basismodel te combineren met verbeterde na-training ", aldus Google.

“In de toekomst zullen we deze denkcapaciteiten rechtstreeks in al onze modellen inbouwen, zodat ze complexere problemen kunnen aanpakken en agenten kunnen ondersteunen met nog beter contextbewustzijn . ”

Hoe verhoudt Gemini 2.5 zich tot OpenAI-modellen?

Google beweert dat Gemini 2.5 beter presteert dan de beste modellen van OpenAI, DeepSeek en andere AI-techgiganten
Google Gemini 2.5 Benchmark

De Gemini 2.5 Pro-modellen van Google presteren beter dan eerdere topmodellen van OpenAI en DeepSeek.

De benchmarkscores voor Gemini 2.5 die Google deelt, zijn behoorlijk indrukwekkend. Gemini 2.5 Pro Experimental behaalde een score van 18,5% bij Humanity's Last Exam.

Die score betekent dat de Gemini 2.5 Pro Experimental, op dit moment in ieder geval, het beste model is op basis van die maatstaf. De score is hoger dan die van OpenAI 03-mini (14%) en DeepSeek R1 (8,6%).

Deze specifieke test wordt als moeilijk beschouwd, hoewel het niet de enige manier is om de prestaties van een AI-model te meten.

Google benadrukte ook de programmeermogelijkheden van de Gemini 2.5 Pro en de benchmarks van het model op het gebied van wiskunde en wetenschap. Gemini 2.5 Pro staat momenteel bovenaan in wiskunde- en wetenschapsbenchmarks, gemeten via GPQA en AIME 2025.

Is het mogelijk om te programmeren in Gemini 2.5?

Programmeren staat centraal in Gemini 2.5. Google claimt “een enorme stap voorwaarts ten opzichte van 2.0” en hint op meer verbeteringen.

Met het nieuwe model van Google kunnen web-apps en agentcodetoepassingen worden gemaakt. Een demo van Google laat zien hoe de Gemini 2.5 Pro wordt gebruikt om een ​​spel te maken op basis van een prompt met één regel.

4 redenen waarom Google's Gemini 2.5 Pro belangrijk is voor zakelijke AI

Hier zijn vier belangrijke punten waar bedrijfsteams rekening mee moeten houden bij het evalueren van de Gemini 2.5 Pro.

1. Gestructureerd, transparant redeneren – een nieuwe standaard voor helderheid van denken

Wat de Gemini 2.5 Pro uniek maakt, is niet alleen zijn intelligentie. Het is ook de manier waarop die intelligentie duidelijk tot uiting komt in het werk dat hij verricht. De stapsgewijze trainingsmethode van Google zorgt voor een gestructureerde gedachtegang die niet lijkt op omhaal of giswerk, zoals we dat kennen van modellen als DeepSeek . Deze CoT's zijn niet beperkt tot oppervlakkige samenvattingen zoals de modellen van OpenAI. Het nieuwe Gemini-model presenteert ideeën in genummerde stappen, met sub-opsommingstekens en een uiterst heldere en transparante interne logica.

In praktische zin is dit een doorbraak op het gebied van betrouwbaarheid en navigeerbaarheid. Zakelijke gebruikers die de output van cruciale taken evalueren – zoals het beoordelen van beleidsconsequenties, het coderen van logica of het samenvatten van complex onderzoek – kunnen nu zien hoe het model tot het antwoord heeft geleid. Dat betekent dat ze antwoorden met meer vertrouwen kunnen valideren, corrigeren of omleiden. Dit is een grote stap voorwaarts ten opzichte van het 'black box'-gevoel dat nog steeds aanwezig is in de uitkomsten van veel grote taalmodellen (LLM) .

Voor een uitgebreidere uitleg over de prestaties van dit model kunt u de video bekijken waarin de Gemini 2.5 Pro live wordt getest. Een voorbeeld dat wordt besproken: Toen Gemini 2.5 Pro werd gevraagd naar de beperkingen van grote taalmodellen, bleek dat ze zich daar opmerkelijk goed van bewust waren. Het schetst veelvoorkomende zwakheden en categoriseert deze in gebieden zoals 'fysieke intuïtie', 'synthese van nieuwe concepten', 'langetermijnplanning' en 'ethische nuances'. Het biedt een raamwerk dat gebruikers helpt te begrijpen wat het model weet en hoe ze het probleem moeten aanpakken.

Bedrijfstechnische teams kunnen deze mogelijkheid benutten om:

  • Debug complexe logische ketens in bedrijfskritische applicaties
  • Beter begrip van modelbeperkingen in specifieke domeinen
  • Het bieden van transparantere, op AI gebaseerde beslissingen aan belanghebbenden
  • Verbeter hun eigen kritisch denkvermogen door de aanpak van het model te bestuderen

Eén opvallende beperking is dat deze gestructureerde redenering weliswaar beschikbaar is in de Gemini-app en Google AI Studio, maar dat deze momenteel niet toegankelijk is via API. Dit is een tekortkoming voor ontwikkelaars die deze mogelijkheid willen integreren in zakelijke applicaties.

2. Een echte kanshebber voor geavanceerde technologie – niet alleen in theorie

Het model staat momenteel met ruime voorsprong bovenaan het Chatbot Arena-klassement: meer dan 35 Elo-punten meer dan het op één na beste model, met name de OpenAI 4o-update die een dag na de lancering van Gemini 2.5 Pro werd gelanceerd. Hoewel benchmarkdominantie vaak maar kort duurt (wekelijks worden er nieuwe modellen gelanceerd), voelt de Gemini 2.5 Pro echt anders aan.

Google beweert dat Gemini 2.5 beter presteert dan de beste modellen van OpenAI, DeepSeek en andere AI-techgiganten

Het programma blinkt uit in taken waarbij diepgaand redeneren nodig is: coderen, genuanceerd probleemoplossen, samenvatten in documenten en zelfs abstracte planning. Bij interne tests presteerde het programma bijzonder goed op eerder moeilijke benchmarks zoals 'Humanity's Last Exam', een populaire benchmark voor het detecteren van LLM-zwakheden op abstracte en genuanceerde gebieden.

Het kan bedrijven niet schelen welk model welke academische ranglijst wint. Maar ze willen wel dat dit model kan denken - en laten zien hoe het denkt. De trillingstest is erg belangrijk.

Zoals de gerespecteerde AI-ingenieur Nathan Lambert opmerkte: "Google heeft weer de beste modellen, omdat zij deze hele AI-hausse hadden moeten starten. De grote fout is hersteld." Zakelijke gebruikers moeten hiermee niet alleen zien dat Google zijn concurrenten inhaalt, maar dat het hen mogelijk voorbijstreeft op het gebied van mogelijkheden die belangrijk zijn voor zakelijke toepassingen.

3. Ten slotte is het encryptiespel van Google sterk

Traditioneel gezien loopt Google achter op OpenAI en Anthropic als het gaat om de ondersteuning van code voor ontwikkelaars. De Gemini 2.5 Pro verandert dat.

Tijdens praktische tests bleek dat het programma sterke one-shot-mogelijkheden biedt bij programmeeruitdagingen, waaronder het bouwen van een werkend Tetris-spel dat in één keer werkte toen het werd geëxporteerd naar Replit. Er was geen debugfunctie nodig. Wat nog opmerkelijker is, is dat de codestructuur helder wordt uitgelegd, variabelen en stappen op een doordachte manier worden gelabeld en de aanpak wordt gepresenteerd voordat er ook maar één regel code is geschreven.

Dit model concurreert met Claude 3.7 Sonnet van Anthropic, dat wordt gezien als marktleider op het gebied van codegeneratie en een belangrijke reden is voor het succes van Anthropic in de zakelijke sector. Maar Gemini 2.5 biedt één belangrijk voordeel: een enorm tokencontextvenster van maximaal 1 miljoen. Claude 3.7 Sonnet biedt momenteel slechts 500.000 tokens aan.

Dit grote contextvenster opent nieuwe mogelijkheden voor het redeneren over de volledige codebase, het lezen van onlinedocumentatie en het werken met meerdere onderling afhankelijke bestanden. De ervaring van softwareontwikkelaar Simon Willison bewijst dit voordeel.

Bij het implementeren van een nieuwe functie in onze codebase met Gemini 2.5 Pro identificeerde het model de benodigde wijzigingen in 18 verschillende bestanden en voltooide het gehele project in ongeveer 45 minuten, met een gemiddelde van minder dan 3 minuten per gewijzigd bestand. Dit is een serieus hulpmiddel voor bedrijven die experimenteren met agentframeworks of op AI gebaseerde ontwikkelomgevingen.

4. Multi-method integratie met agent-achtig gedrag

Hoewel sommige modellen, zoals de nieuwste 4o van OpenAI, misschien meer flitsende beelden laten zien, lijkt het erop dat de Gemini 2.5 Pro stilletjes aan een nieuwe definitie geeft aan wat gefundeerd multimodaal redeneren inhoudt.

In een praktisch experiment van Ben Dickson voor VentureBeat werd bijvoorbeeld aangetoond dat het model belangrijke informatie uit een technisch artikel over zoekalgoritmen kan halen en een bijbehorend SVG-stroomdiagram kan genereren. Vervolgens kan het stroomdiagram worden verbeterd door een gerenderde versie met visuele fouten te tonen. Dankzij dit niveau van multimodaal redeneren kunnen nieuwe workflows worden gecreëerd die voorheen niet mogelijk waren met modellen die alleen uit tekst bestonden.

In een ander voorbeeld uploadde ontwikkelaar Sam Witteveen een eenvoudige schermafbeelding van een kaart van Las Vegas en vroeg hij welke Google-evenementen er op 9 april in de buurt plaatsvonden. Het model identificeerde de locatie, leidde de intentie van de gebruiker af, zocht online en leverde nauwkeurige informatie over Google Cloud Next op, inclusief datum, locatie en bronvermelding. Dit alles gebeurt zonder een aangepast agentframework, alleen het kernmodel en de ingebouwde zoekfunctie.

Dit multimodale input-redeneringsmodel gaat eigenlijk verder dan er alleen naar kijken. Het geeft een beeld van hoe een bedrijfsproces er over 6 maanden uit zou kunnen zien: upload documenten, diagrammen en dashboards en laat het model de inhoud synthetiseren, plannen of zinvolle acties ondernemen op basis van de inhoud.

Leave a Comment

Gmail voegt blauw vinkje toe om betrouwbare afzenders te verifiëren

Gmail voegt blauw vinkje toe om betrouwbare afzenders te verifiëren

Door de ontwikkeling en populariteit van sociale media is het "blauwe vinkje" al geruime tijd een van de machtigste figuren in de internetwereld.

Chromecast is officieel dood

Chromecast is officieel dood

De Chromecast-lijn van Google is al lang een populaire keuze als u uw smart-tv-ervaring wilt vervangen of van elke tv een smart-tv wilt maken.

Google voegt functie toe om apps automatisch te openen na installatie in de Play Store

Google voegt functie toe om apps automatisch te openen na installatie in de Play Store

Google voegt een kleine maar langverwachte nieuwe functie toe aan de Play Store.

Google kondigt Android XR aan, een nieuw besturingssysteemplatform voor AR- en VR-brillen

Google kondigt Android XR aan, een nieuw besturingssysteemplatform voor AR- en VR-brillen

Na jaren van verwaarlozing heeft Google eindelijk besloten om zijn investeringen weer te richten op Extended Reality (XR)-apparaten zoals headsets en brillen.

5 redenen om Google Gemini te proberen

5 redenen om Google Gemini te proberen

Hoewel Gemini AI van Google minder vaak wordt besproken dan sommige concurrenten, heeft het veel te bieden. Hier zijn vijf redenen waarom Gemini uw aandacht verdient.

Welke smartphonefabrikant heeft de beste Android-updates?

Welke smartphonefabrikant heeft de beste Android-updates?

Er zijn veel Android-fabrikanten, maar niet allemaal besteden ze aandacht aan software-updates. Hoewel de situatie de afgelopen tien jaar is verbeterd, bieden nog niet alle smartphonefabrikanten geweldige softwareondersteuning.

Googles Gemini reageert met vreemde, herhaalde onzinwoorden op sommige gebruikers

Googles Gemini reageert met vreemde, herhaalde onzinwoorden op sommige gebruikers

Onlangs merkten sommige gebruikers op dat Google Gemini in sommige reacties herhalende tekst, vreemde tekens en complete onzin gaf.

Google verwijdert Gemini Access uit de Google-app voor iPhone

Google verwijdert Gemini Access uit de Google-app voor iPhone

De Google-app voor de iPhone wordt binnenkort wat minder nuttig, omdat Google onlangs de toegang tot Gemini AI via die app heeft ingetrokken.

Wat gebeurt er als u uw Google-account verliest?

Wat gebeurt er als u uw Google-account verliest?

Als u geen toegang meer hebt tot uw Google-account, kan dat ernstige gevolgen hebben. Dat gaat verder dan het niet meer kunnen versturen en ontvangen van e-mail.

Google lanceert AI-videocreatiefunctie op Gemini

Google lanceert AI-videocreatiefunctie op Gemini

Google heeft zojuist aangekondigd dat gebruikers nu video's kunnen maken met behulp van kunstmatige intelligentie via de Gemini-chatbot en de onlangs gelanceerde experimentele tool Whisk.

Google lanceert Career Dreamer, de nieuwste AI-tool die helpt bij het kiezen van de perfecte carrière

Google lanceert Career Dreamer, de nieuwste AI-tool die helpt bij het kiezen van de perfecte carrière

Of u nu uw eerste stappen op de arbeidsmarkt zet of de overstap naar een nieuwe sector maakt, de experimentele Career Dreamer van Google is ontworpen om u in contact te brengen met geschikte functies.

Google ontwikkelt AI-winkeltool waarmee gebruikers thuis jurken en shirts kunnen passen

Google ontwikkelt AI-winkeltool waarmee gebruikers thuis jurken en shirts kunnen passen

Vorig jaar introduceerde Google een op AI gebaseerde winkelassistent in Search waarmee gebruikers een visueel idee kunnen krijgen van hoe een kledingstuk staat op een specifiek lichaamstype.

Google ontwikkelt AI-algoritme dat huidziekten en tuberculose kan diagnosticeren

Google ontwikkelt AI-algoritme dat huidziekten en tuberculose kan diagnosticeren

Google toont steeds meer interesse in de toepassingen van kunstmatige intelligentie in de geneeskunde.

Google bevestigt probleem met tweede generatie Chromecast en Chromecast Audio

Google bevestigt probleem met tweede generatie Chromecast en Chromecast Audio

Na een paar dagen van verwarring heeft Google officieel bevestigd dat er een probleem is met zowel de tweede generatie Chromecast als de Chromecast Audio.

Google heeft per ongeluk documentatie gepubliceerd over hoe zoeken werkt

Google heeft per ongeluk documentatie gepubliceerd over hoe zoeken werkt

Maandag lekten interne documenten uit waarin de factoren worden beschreven die Google Zoeken overweegt bij het rangschikken en weergeven van webresultaten.

Hoe houd je Microsoft Teams de hele dag actief en beschikbaar?

Hoe houd je Microsoft Teams de hele dag actief en beschikbaar?

Leer hoe je Microsoft Teams de hele dag actief en beschikbaar houdt. Bewezen tips, tools en instellingen om de status 'Afwezig' te voorkomen, je productiviteit te verhogen en geen moment te missen tijdens je werkdag.

Hoe los je afspeelfouten van media in Microsoft Teams op in 2026?

Hoe los je afspeelfouten van media in Microsoft Teams op in 2026?

Ben je het zat dat audio-, video- en deelproblemen in Microsoft Teams je vergaderingen in 2026 verstoren? Volg onze deskundige, stapsgewijze handleiding om audio-, video- en deelproblemen snel op te lossen – zonder technische kennis. Naadloze samenwerking is binnen handbereik!

Problemen met de Microsoft Teams Mac-sleutelbos oplossen

Problemen met de Microsoft Teams Mac-sleutelbos oplossen

Heb je problemen met de sleutelhangers van Microsoft Teams op je Mac? Ontdek bewezen, stapsgewijze oplossingen voor macOS om weer probleemloos samen te werken. Snelle oplossingen vind je hier!

Het probleem oplossen dat je via een directe link deelneemt aan een vergadering in Microsoft Teams

Het probleem oplossen dat je via een directe link deelneemt aan een vergadering in Microsoft Teams

Krijg je problemen met het deelnemen aan een vergadering in Microsoft Teams? Ontdek bewezen stappen om dit op te lossen via directe links. Snelle oplossingen voor probleemloos deelnemen – geen technische kennis vereist!

Problemen met vertraging in Microsoft Teams-videoconferenties via wifi oplossen

Problemen met vertraging in Microsoft Teams-videoconferenties via wifi oplossen

Heb je last van vertraging tijdens videoconferenties in Microsoft Teams via wifi? Deze ultieme handleiding voor probleemoplossing biedt snelle oplossingen, geavanceerde tips en wifi-optimalisaties om direct weer kristalheldere videogesprekken te voeren.

Hoe u de cache van Microsoft Teams kunt wissen om prestatieproblemen op te lossen

Hoe u de cache van Microsoft Teams kunt wissen om prestatieproblemen op te lossen

Ervaart u problemen met een traag Microsoft Teams? Leer stap voor stap hoe u de cache van Microsoft Teams kunt wissen om prestatieproblemen, vertragingen en crashes op te lossen en de snelheid te verhogen op Windows, Mac, via de webbrowser en op mobiele apparaten. Snelle oplossingen die werken!

Hoe los je Microsoft Teams-fout 1200 op je telefoon op (iOS/Android)?

Hoe los je Microsoft Teams-fout 1200 op je telefoon op (iOS/Android)?

Heb je genoeg van Microsoft Teams-fout 1200 die je telefoongesprekken laat vastlopen? Ontdek snelle, stapsgewijze oplossingen voor iOS en Android, zodat je snel weer probleemloos kunt samenwerken – zonder technische kennis!

Waar bevinden zich de registerinstellingen van Microsoft Teams in Windows 11?

Waar bevinden zich de registerinstellingen van Microsoft Teams in Windows 11?

Ontdek de exacte locaties van de Microsoft Teams-registersleutels in Windows 11. Een stapsgewijze handleiding om ze te vinden, te openen en veilig aan te passen voor optimale prestaties en probleemoplossing. Essentieel voor IT-professionals en Teams-enthousiasten.

Waar vind ik de installatiemap van Microsoft Teams op mijn pc?

Waar vind ik de installatiemap van Microsoft Teams op mijn pc?

Kunt u de installatiemap van Microsoft Teams niet vinden op uw pc? Deze stapsgewijze handleiding laat u de exacte paden zien voor nieuwe en klassieke Teams-installaties, per gebruiker en per computer. Bespaar tijd bij het oplossen van problemen!

Hoe los je een aanmeldingsfout bij Microsoft Teams op Chromebooks op?

Hoe los je een aanmeldingsfout bij Microsoft Teams op Chromebooks op?

Heb je problemen met inloggen bij Microsoft Teams op je Chromebook? Ontdek stapsgewijze oplossingen om inlogproblemen snel op te lossen. Wis de cache, update apps en meer voor naadloos samenwerken. Werkt met de nieuwste Chrome OS!

Waar vind ik Microsoft Teams in Outlook? Het ontbrekende pictogram vinden

Waar vind ik Microsoft Teams in Outlook? Het ontbrekende pictogram vinden

Bent u gefrustreerd door het ontbrekende Microsoft Teams-pictogram in Outlook? Ontdek precies waar u het kunt vinden, waarom het verdwijnt en welke bewezen stappen u kunt volgen om het terug te plaatsen voor probleemloze vergaderingen. Bijgewerkt voor de nieuwste versies!

Hoe Microsoft Teams Copilot te gebruiken voor productiviteit met behulp van AI

Hoe Microsoft Teams Copilot te gebruiken voor productiviteit met behulp van AI

Ontdek hoe je Microsoft Teams Copilot kunt gebruiken om je productiviteit met AI te verhogen. Een stapsgewijze handleiding, belangrijke functies en tips om vergaderingen, chats en taken moeiteloos te transformeren. Ontgrendel vandaag nog slimmere samenwerking!

Hoe maak je een bot aan en beheer je deze in Microsoft Teams (2026)?

Hoe maak je een bot aan en beheer je deze in Microsoft Teams (2026)?

Leer hoe je een bot maakt en beheert in Microsoft Teams (2026) met deze deskundige handleiding. Van de installatie tot geavanceerd beheer: profiteer van een hogere productiviteit dankzij het nieuwste Bot Framework en de Azure-tools.

Waarom staat mijn status in Microsoft Teams vast op Afwezig?

Waarom staat mijn status in Microsoft Teams vast op Afwezig?

Ben je gefrustreerd omdat je Microsoft Teams-status vastzit op 'Afwezig'? Ontdek de belangrijkste oorzaken, zoals time-outs bij inactiviteit en energie-instellingen, plus stapsgewijze oplossingen om snel weer 'Beschikbaar' te worden. Bijgewerkt met de nieuwste Teams-functies.

Zo test je de audio en camera van Microsoft Teams vóór een gesprek.

Zo test je de audio en camera van Microsoft Teams vóór een gesprek.

Ontdek eenvoudige stappen om de audio en camera van Microsoft Teams te testen vóór een gesprek. Zorg met onze handige handleiding voor kristalhelder geluid en beeld tijdens professionele vergaderingen. Perfect voor desktop-, mobiele en webgebruikers.