OpenAI kondigt GPT-4.1 aan - het slimste model voor complexe taken

OpenAI heeft officieel drie nieuwe modellen geïntroduceerd: GPT-4.1, GPT-4.1 mini en GPT-4.1 nano. Deze modellen beschikken over enorme contextverwerkingscapaciteiten van maximaal 1 miljoen tokens en kennislimieten die zijn bijgewerkt tot juni 2024.

Volgens het bedrijf presteren deze modellen beter dan de onlangs geüpdatete GPT-4o en GPT-4o mini, die afgelopen juli werden gelanceerd. Momenteel is GPT-4.1 alleen beschikbaar via API. U kunt het dus nog niet rechtstreeks in ChatGPT gebruiken.

OpenAI merkt op dat GPT-4.1 alleen via API beschikbaar zal zijn. In ChatGPT zijn veel verbeteringen op het gebied van instructienaleving, programmering en intelligentie geleidelijk geïntegreerd in de nieuwste versie van GPT-4o en het bedrijf zal in toekomstige releases nog meer verbeteringen toevoegen.

OpenAI kondigt GPT-4.1 aan - het slimste model voor complexe taken

Benchmarks tonen de opmerkelijke verbeteringen aan die GPT-4.1 met zich meebrengt. Dit model scoort 54,6% op SWE-bench Verified, een stijging van 21,4 punten ten opzichte van GPT-4o. Het model scoorde 38,3% op MultiChallenge, een benchmark die de naleving van richtlijnen meet, en vestigde een nieuw record voor het begrijpen van lange video's met een score van 72,0% op de Video-MME-benchmark, waarbij modellen video's tot een uur lang analyseren zonder ondertiteling.

OpenAI heeft ook samengewerkt met alfapartners om de prestaties van GPT-4.1 in praktijksituaties te testen.

  • Thomson Reuters testte GPT-4.1 met zijn juridische AI-assistent CoCounsel. Vergeleken met GPT-4o laat GPT-4.1 een 17% hogere nauwkeurigheid zien bij de evaluatie van meerdere documenten. Dit soort werk is sterk afhankelijk van het vermogen om context over meerdere bronnen te volgen en complexe relaties te identificeren, zoals conflicterende termen of verborgen afhankelijkheden. GPT-4.1 heeft hierover consequent goede prestaties geleverd.
  • Carlyle gebruikte GPT-4.1 om financiële gegevens uit lange en complexe documenten te halen, waaronder Excel- en PDF-bestanden. Volgens de interne benchmarks van het bedrijf presteert het model 50% beter dan eerdere modellen op het gebied van documentherstel. Het is het eerste model dat op betrouwbare wijze problemen aanpakt, zoals het vinden van een speld in een hooiberg, het kwijtraken van informatie in het midden van een document en argumenten waarbij informatie uit meerdere bestanden met elkaar verbonden moet worden.

Prestaties zijn één ding, maar snelheid is net zo belangrijk. Volgens OpenAI retourneert GPT-4.1 het eerste token binnen ongeveer 15 seconden bij de verwerking van 128.000 tokens, en tot 30 seconden bij de verwerking van een miljoen tokens. GPT-4.1 mini en nano zijn nog sneller.

GPT-4.1 nano reageert doorgaans in minder dan 5 seconden op prompts met 128.000 invoertokens. Snelle caching kan de latentie verder verminderen en tegelijkertijd kosten besparen.

Ook het beeldbegrip maakte een grote sprong voorwaarts. De GPT-4.1 mini presteert met name beter dan de GPT-4o in verschillende visuele benchmarks.

  • Op MMMU (inclusief grafieken, diagrammen en kaarten) scoorde GPT-4.1 mini 73%. Dit is hoger dan GPT-4.5 en overtreft ruimschoots de 56% van GPT-4o mini.
  • Op MathVista (een testprogramma voor het oplossen van beeldproblemen) scoorden zowel GPT-4.1 als GPT-4.1 mini 57%, wat aanzienlijk hoger is dan de 37% van GPT-4o mini.
  • Op het gebied van CharXiv-Reasoning , waarbij modellen vragen beantwoorden op basis van wetenschappelijke grafieken, blijft GPT-4.1 voorop lopen.
  • Bij Video-MME (lange video's zonder ondertiteling) behaalde GPT-4.1 een score van 72%, een aanzienlijke verbetering ten opzichte van de 65% van GPT-4o.

Over de prijs:

  • GPT-4.1 kost $2 per 1 miljoen tokens-input en $8 voor output.
  • De GPT-4.1 mini kost $0,40 voor invoer en $1,60 voor uitvoer.
  • GPT-4.1 nano kost $0,10 invoer en $0,40 uitvoer.

Door gebruik te maken van prompt caching of de Batch API kunnen deze kosten nog verder verlaagd worden, wat zeer nuttig is voor grootschalige toepassingen. OpenAI bereidt zich ook voor om de ondersteuning voor GPT-4.5 Preview op 14 juli 2025 te beëindigen. Als reden wordt aangevoerd dat GPT-4.1 betere prestaties, een lagere latentie en lagere kosten biedt.

Sign up and earn $1000 a day ⋙

Leave a Comment

O1-pro is tot nu toe het duurste AI-model van OpenAI

O1-pro is tot nu toe het duurste AI-model van OpenAI

OpenAI heeft een krachtigere versie van zijn o1-redenerings-AI-model, o1-pro, uitgebracht in zijn ontwikkelaars-API.

OpenAI kondigt ChatGPT Pro-abonnement aan voor maar liefst $ 200 per maand

OpenAI kondigt ChatGPT Pro-abonnement aan voor maar liefst $ 200 per maand

OpenAI biedt momenteel vier ChatGPT-abonnementsniveaus om tegemoet te komen aan de behoeften van verschillende klantgroepen.

OpenAI introduceert ChatGPT-projecten: nieuwe functies voor het organiseren van slimmere gesprekken

OpenAI introduceert ChatGPT-projecten: nieuwe functies voor het organiseren van slimmere gesprekken

Door een project te maken, kunnen gebruikers gesprekken, bestanden en aanpassingsinstructies op één plek bewaren. Hierdoor kunnen ze gemakkelijk weer verder met waar ze mee bezig waren.

OpenAI kondigt initiatief aan om AI-normen voor industrieën te ontwikkelen

OpenAI kondigt initiatief aan om AI-normen voor industrieën te ontwikkelen

OpenAI heeft zojuist het Pioneers Program aangekondigd, een initiatief om de toepassing van AI in praktijksituaties te bevorderen.

Softbank wil Microsoft voorbijstreven en de grootste investeerder van OpenAI worden

Softbank wil Microsoft voorbijstreven en de grootste investeerder van OpenAI worden

De Japanse investeringsgigant Softbank is van plan om 15 tot 25 miljard dollar te investeren in OpenAI. Als de deal doorgaat, wordt Softbank de grootste investeerder van OpenAI en vervangt daarmee Microsoft, dat op dit moment die positie bekleedt.

Gebruikers kunnen met de Kerstman chatten via de spraakmodus van ChatGPT

Gebruikers kunnen met de Kerstman chatten via de spraakmodus van ChatGPT

Met ChatGPT kunt u uw taken beter uitvoeren, doordat u direct met de Kerstman kunt chatten.

OpenAI brengt in december Orion uit, zijn volgende grote AI-model

OpenAI brengt in december Orion uit, zijn volgende grote AI-model

Volgens The Verge is OpenAI van plan om in december Orion, het volgende grote AI-model, te lanceren.

Alibaba lanceert AI-model dat menselijke emoties kan lezen

Alibaba lanceert AI-model dat menselijke emoties kan lezen

De Chinese e-commercegigant Alibaba blijft in het nieuws met de lancering van een nieuw AI-model waarvan het bedrijf beweert dat het menselijke emoties kan lezen.

OpenAI lanceert GPT Store en ChatGPT Team, waarmee het ChatGPT-ecosysteem naar een hoger niveau wordt getild

OpenAI lanceert GPT Store en ChatGPT Team, waarmee het ChatGPT-ecosysteem naar een hoger niveau wordt getild

Na lang wachten en talloze geruchten heeft OpenAI eindelijk de langverwachte lancering van de GPT Store en ChatGPT Team aangekondigd.

Amazon kondigt Nova Sonic-geluidsmodel aan en claimt dat de prestaties die van OpenAI en Google overtreffen

Amazon kondigt Nova Sonic-geluidsmodel aan en claimt dat de prestaties die van OpenAI en Google overtreffen

Amazon introduceerde vandaag Nova Sonic, een geavanceerd spraak-naar-spraakmodel waarmee ontwikkelaars apps kunnen bouwen die in realtime met menselijke stemmen kunnen communiceren.

Copilot is de beste manier om GPT-4 Turbo gratis te gebruiken

Copilot is de beste manier om GPT-4 Turbo gratis te gebruiken

Als u GPT-4 Turbo wilt uitproberen, kunt u het beste de Copilot-tool van Microsoft gebruiken.

OpenAI maakt in stilte een einde aan de held GPT-4

OpenAI maakt in stilte een einde aan de held GPT-4

OpenAI stopt officieel met GPT-4, een van de bekendste AI-modellen van het bedrijf dat twee jaar geleden viraal ging.

OpenAI staat op het punt een overeenkomst te sluiten met Samsung om zijn AI-functies in Galaxy-telefoons te gebruiken

OpenAI staat op het punt een overeenkomst te sluiten met Samsung om zijn AI-functies in Galaxy-telefoons te gebruiken

Volgens de Zuid-Koreaanse publicatie The Korea Herald wil de gigant op het gebied van kunstmatige intelligentie OpenAI zich positioneren als een potentiële concurrent van Google.

OpenAI ontwikkelt technologie voor stemreconstructie op basis van een opname van slechts 15 seconden

OpenAI ontwikkelt technologie voor stemreconstructie op basis van een opname van slechts 15 seconden

OpenAI lanceert technologie die met een opname van slechts 15 seconden ieders stem kan nabootsen.

12 instellingen op Samsung Galaxy-telefoons die u zou moeten wijzigen

12 instellingen op Samsung Galaxy-telefoons die u zou moeten wijzigen

Hebt u zojuist een Samsung Galaxy-telefoon gekocht en wilt u deze configureren? Hier zijn 10 instellingen die u kunt wijzigen om uw Samsung-telefoon beter te laten werken.

Laatste Murder Mystery 2-codes en hoe je ze kunt invoeren

Laatste Murder Mystery 2-codes en hoe je ze kunt invoeren

Met Code Murder Mystery 2 kunnen spelers meer messenskins voor hun personages kiezen of meer geld krijgen om te gebruiken voor diensten en andere dingen in het spel te kopen.

28 prachtige verjaardagskaartontwerpen met goede wensen voor ouders, echtgenoten, geliefden en vrienden

28 prachtige verjaardagskaartontwerpen met goede wensen voor ouders, echtgenoten, geliefden en vrienden

Voor de verjaardag van je geliefde, ouders, vrienden, broers, zussen, collega's... vergeet naast de cadeautjes niet om verjaardagskaarten met wensen te sturen.

Grappige maar lieve flirtraadsels die het hart van je crush zullen veroveren

Grappige maar lieve flirtraadsels die het hart van je crush zullen veroveren

Met deze leuke quizzen maak je een sterke indruk en verover je snel en gelukkig het hart van je vlam.

Corki DTCL seizoen 7: Bouw items, standaard Corki Gunner-team

Corki DTCL seizoen 7: Bouw items, standaard Corki Gunner-team

Corki DTCL seizoen 7 heeft bescherming en ondersteuning nodig om de controle te behouden en het vijandelijke team te kunnen vernietigen. Tegelijkertijd moet Corki's uitrusting ook op standaardniveau zijn om effectiever schade te kunnen aanrichten.

Hoe Mini World Royale te downloaden en instructies voor het spelen

Hoe Mini World Royale te downloaden en instructies voor het spelen

Hier is de downloadlink voor Mini World Royale en instructies voor het spelen. We hebben twee versies: Mini World Royale APK en Mini World Royale iOS.

Wat is 1314?

Wat is 1314?

1314 is een getal dat vaak door jongeren als liefdescode wordt gebruikt. Maar wat 1314 is en wat het betekent, weet nog niet iedereen.

Hoe u uw mentale en fysieke gezondheid kunt beschermen in een giftige omgeving

Hoe u uw mentale en fysieke gezondheid kunt beschermen in een giftige omgeving

Omgaan met giftige situaties kan ontzettend moeilijk zijn. Hier volgen enkele tips die u kunnen helpen om tactvol om te gaan met giftige omgevingen en uw gemoedsrust te behouden.

Manieren waarop muziek de hersenen stimuleert

Manieren waarop muziek de hersenen stimuleert

De meeste mensen weten dat muziek niet alleen voor entertainment is, maar dat het nog veel meer voordelen heeft. Hier zijn enkele manieren waarop muziek de ontwikkeling van onze hersenen stimuleert.

De meest voorkomende tekorten aan voedingsstoffen in het dieet

De meest voorkomende tekorten aan voedingsstoffen in het dieet

Voeding is erg belangrijk voor onze gezondheid. Toch ontbreken deze zes belangrijke voedingsstoffen vaak in onze voeding.

Hoe u de CK Club-app van Circle K kunt gebruiken om aantrekkelijke aanbiedingen te ontvangen

Hoe u de CK Club-app van Circle K kunt gebruiken om aantrekkelijke aanbiedingen te ontvangen

Om de snelste promotie-informatie van Circle K te ontvangen, moet u de CK Club-app installeren. De applicatie slaat betalingen op bij het winkelen of betalen bij Circle K, maar ook het aantal gespaarde stempels.

Instagram staat reels toe van maximaal 3 minuten lang

Instagram staat reels toe van maximaal 3 minuten lang

Instagram heeft zojuist aangekondigd dat gebruikers Reels-video's van maximaal 3 minuten kunnen posten. Dat is het dubbele van de eerdere limiet van 90 seconden.

Hoe u CPU-informatie van een Chromebook kunt bekijken

Hoe u CPU-informatie van een Chromebook kunt bekijken

Dit artikel legt uit hoe u CPU-informatie kunt bekijken en de CPU-snelheid rechtstreeks op uw Chromebook kunt controleren.

8 coole dingen die je met een oude Android-tablet kunt doen

8 coole dingen die je met een oude Android-tablet kunt doen

Als u uw oude tablet niet wilt verkopen of weggeven, kunt u deze op 5 manieren gebruiken: als een hoogwaardige fotolijst, muziekspeler, e-book- en tijdschriftenlezer, huishoudelijk hulpmiddel en als tweede scherm.

Hoe krijg je snel mooie nagels?

Hoe krijg je snel mooie nagels?

U wilt snel mooie, glanzende en gezonde nagels hebben. Deze eenvoudige tips voor mooie nagels hieronder zullen nuttig voor u zijn.