OpenAI kondigt GPT-4.1 aan - het slimste model voor complexe taken

OpenAI heeft officieel drie nieuwe modellen geïntroduceerd: GPT-4.1, GPT-4.1 mini en GPT-4.1 nano. Deze modellen beschikken over enorme contextverwerkingscapaciteiten van maximaal 1 miljoen tokens en kennislimieten die zijn bijgewerkt tot juni 2024.

Volgens het bedrijf presteren deze modellen beter dan de onlangs geüpdatete GPT-4o en GPT-4o mini, die afgelopen juli werden gelanceerd. Momenteel is GPT-4.1 alleen beschikbaar via API. U kunt het dus nog niet rechtstreeks in ChatGPT gebruiken.

OpenAI merkt op dat GPT-4.1 alleen via API beschikbaar zal zijn. In ChatGPT zijn veel verbeteringen op het gebied van instructienaleving, programmering en intelligentie geleidelijk geïntegreerd in de nieuwste versie van GPT-4o en het bedrijf zal in toekomstige releases nog meer verbeteringen toevoegen.

OpenAI kondigt GPT-4.1 aan - het slimste model voor complexe taken

Benchmarks tonen de opmerkelijke verbeteringen aan die GPT-4.1 met zich meebrengt. Dit model scoort 54,6% op SWE-bench Verified, een stijging van 21,4 punten ten opzichte van GPT-4o. Het model scoorde 38,3% op MultiChallenge, een benchmark die de naleving van richtlijnen meet, en vestigde een nieuw record voor het begrijpen van lange video's met een score van 72,0% op de Video-MME-benchmark, waarbij modellen video's tot een uur lang analyseren zonder ondertiteling.

OpenAI heeft ook samengewerkt met alfapartners om de prestaties van GPT-4.1 in praktijksituaties te testen.

  • Thomson Reuters testte GPT-4.1 met zijn juridische AI-assistent CoCounsel. Vergeleken met GPT-4o laat GPT-4.1 een 17% hogere nauwkeurigheid zien bij de evaluatie van meerdere documenten. Dit soort werk is sterk afhankelijk van het vermogen om context over meerdere bronnen te volgen en complexe relaties te identificeren, zoals conflicterende termen of verborgen afhankelijkheden. GPT-4.1 heeft hierover consequent goede prestaties geleverd.
  • Carlyle gebruikte GPT-4.1 om financiële gegevens uit lange en complexe documenten te halen, waaronder Excel- en PDF-bestanden. Volgens de interne benchmarks van het bedrijf presteert het model 50% beter dan eerdere modellen op het gebied van documentherstel. Het is het eerste model dat op betrouwbare wijze problemen aanpakt, zoals het vinden van een speld in een hooiberg, het kwijtraken van informatie in het midden van een document en argumenten waarbij informatie uit meerdere bestanden met elkaar verbonden moet worden.

Prestaties zijn één ding, maar snelheid is net zo belangrijk. Volgens OpenAI retourneert GPT-4.1 het eerste token binnen ongeveer 15 seconden bij de verwerking van 128.000 tokens, en tot 30 seconden bij de verwerking van een miljoen tokens. GPT-4.1 mini en nano zijn nog sneller.

GPT-4.1 nano reageert doorgaans in minder dan 5 seconden op prompts met 128.000 invoertokens. Snelle caching kan de latentie verder verminderen en tegelijkertijd kosten besparen.

Ook het beeldbegrip maakte een grote sprong voorwaarts. De GPT-4.1 mini presteert met name beter dan de GPT-4o in verschillende visuele benchmarks.

  • Op MMMU (inclusief grafieken, diagrammen en kaarten) scoorde GPT-4.1 mini 73%. Dit is hoger dan GPT-4.5 en overtreft ruimschoots de 56% van GPT-4o mini.
  • Op MathVista (een testprogramma voor het oplossen van beeldproblemen) scoorden zowel GPT-4.1 als GPT-4.1 mini 57%, wat aanzienlijk hoger is dan de 37% van GPT-4o mini.
  • Op het gebied van CharXiv-Reasoning , waarbij modellen vragen beantwoorden op basis van wetenschappelijke grafieken, blijft GPT-4.1 voorop lopen.
  • Bij Video-MME (lange video's zonder ondertiteling) behaalde GPT-4.1 een score van 72%, een aanzienlijke verbetering ten opzichte van de 65% van GPT-4o.

Over de prijs:

  • GPT-4.1 kost $2 per 1 miljoen tokens-input en $8 voor output.
  • De GPT-4.1 mini kost $0,40 voor invoer en $1,60 voor uitvoer.
  • GPT-4.1 nano kost $0,10 invoer en $0,40 uitvoer.

Door gebruik te maken van prompt caching of de Batch API kunnen deze kosten nog verder verlaagd worden, wat zeer nuttig is voor grootschalige toepassingen. OpenAI bereidt zich ook voor om de ondersteuning voor GPT-4.5 Preview op 14 juli 2025 te beëindigen. Als reden wordt aangevoerd dat GPT-4.1 betere prestaties, een lagere latentie en lagere kosten biedt.

Sign up and earn $1000 a day ⋙

Leave a Comment

OpenAI kondigt Operator aan, een AI-agent die automatisch taken namens de gebruiker uitvoert

OpenAI kondigt Operator aan, een AI-agent die automatisch taken namens de gebruiker uitvoert

Het bedrijf achter ChatGPT onthult een nieuwe manier om AI te gebruiken. OpenAI heeft zojuist Operator aangekondigd, een AI-agent die automatisch taken voor u kan uitvoeren.

OpenAI lanceert nieuwe tool om ontwikkelaars te helpen bij het bouwen van AI-agenten

OpenAI lanceert nieuwe tool om ontwikkelaars te helpen bij het bouwen van AI-agenten

OpenAI ziet AI-agenten als de toekomst van de kunstmatige-intelligentiesector en geeft toe dat het bouwen van krachtige, 'industriële' agenten met de huidige tools erg lastig is.

Alibaba onthult QwQ-32b, een waardige concurrent voor DeepSeek

Alibaba onthult QwQ-32b, een waardige concurrent voor DeepSeek

Of de claims van Alibaba werkelijkheid worden, is nog maar de vraag, maar het lijkt erop dat ChatGPT en DeepSeek er een waardige nieuwe concurrent bij hebben.

OpenAI daagt Google Chrome uit met zijn nieuwe browser

OpenAI daagt Google Chrome uit met zijn nieuwe browser

OpenAI werkt naar verluidt aan een webbrowserproject dat de potentie heeft om direct te concurreren met Google Chrome.

Samsung werkt samen met OpenAI om AI-tv te ontwikkelen, met veel veelbelovende functies

Samsung werkt samen met OpenAI om AI-tv te ontwikkelen, met veel veelbelovende functies

Volgens berichten werkt Samsung Electronics samen met OpenAI aan een ambitieus gezamenlijk project om AI-tv's te ontwikkelen die gebruikmaken van toonaangevende kunstmatige intelligentietechnologieën.

Microsoft zal zwaar blijven investeren in OpenAI, met een waardering van meer dan 100 miljard dollar.

Microsoft zal zwaar blijven investeren in OpenAI, met een waardering van meer dan 100 miljard dollar.

Microsoft heeft sinds 2019 miljarden dollars geïnvesteerd in OpenAI, hoewel de softwaregigant uit Redmond zeker niet de belangrijkste investeerder is in de innovatieve AI-startup.

O1-pro is tot nu toe het duurste AI-model van OpenAI

O1-pro is tot nu toe het duurste AI-model van OpenAI

OpenAI heeft een krachtigere versie van zijn o1-redenerings-AI-model, o1-pro, uitgebracht in zijn ontwikkelaars-API.

OpenAI kondigt ChatGPT Pro-abonnement aan voor maar liefst $ 200 per maand

OpenAI kondigt ChatGPT Pro-abonnement aan voor maar liefst $ 200 per maand

OpenAI biedt momenteel vier ChatGPT-abonnementsniveaus om tegemoet te komen aan de behoeften van verschillende klantgroepen.

OpenAI introduceert ChatGPT-projecten: nieuwe functies voor het organiseren van slimmere gesprekken

OpenAI introduceert ChatGPT-projecten: nieuwe functies voor het organiseren van slimmere gesprekken

Door een project te maken, kunnen gebruikers gesprekken, bestanden en aanpassingsinstructies op één plek bewaren. Hierdoor kunnen ze gemakkelijk weer verder met waar ze mee bezig waren.

OpenAI kondigt initiatief aan om AI-normen voor industrieën te ontwikkelen

OpenAI kondigt initiatief aan om AI-normen voor industrieën te ontwikkelen

OpenAI heeft zojuist het Pioneers Program aangekondigd, een initiatief om de toepassing van AI in praktijksituaties te bevorderen.

Softbank wil Microsoft voorbijstreven en de grootste investeerder van OpenAI worden

Softbank wil Microsoft voorbijstreven en de grootste investeerder van OpenAI worden

De Japanse investeringsgigant Softbank is van plan om 15 tot 25 miljard dollar te investeren in OpenAI. Als de deal doorgaat, wordt Softbank de grootste investeerder van OpenAI en vervangt daarmee Microsoft, dat op dit moment die positie bekleedt.

Gebruikers kunnen met de Kerstman chatten via de spraakmodus van ChatGPT

Gebruikers kunnen met de Kerstman chatten via de spraakmodus van ChatGPT

Met ChatGPT kunt u uw taken beter uitvoeren, doordat u direct met de Kerstman kunt chatten.

OpenAI brengt in december Orion uit, zijn volgende grote AI-model

OpenAI brengt in december Orion uit, zijn volgende grote AI-model

Volgens The Verge is OpenAI van plan om in december Orion, het volgende grote AI-model, te lanceren.

Alibaba lanceert AI-model dat menselijke emoties kan lezen

Alibaba lanceert AI-model dat menselijke emoties kan lezen

De Chinese e-commercegigant Alibaba blijft in het nieuws met de lancering van een nieuw AI-model waarvan het bedrijf beweert dat het menselijke emoties kan lezen.

Verschil tussen gewone tv en smart-tv

Verschil tussen gewone tv en smart-tv

Smart-tv's hebben de wereld veroverd. Dankzij zoveel geweldige functies en internetverbinding heeft technologie de manier waarop we televisiekijken veranderd.

Waarom heeft de vriezer geen lampje, maar de koelkast wel?

Waarom heeft de vriezer geen lampje, maar de koelkast wel?

Koelkasten zijn vertrouwde apparaten in huishoudens. Koelkasten hebben meestal twee compartimenten. Het koelvak is ruim en heeft verlichting die automatisch aangaat wanneer de gebruiker het vak opent. Het vriesvak is smal en heeft geen verlichting.

2 manieren om netwerkcongestie te verhelpen die wifi vertraagt

2 manieren om netwerkcongestie te verhelpen die wifi vertraagt

Wi-Fi-netwerken worden niet alleen beïnvloed door routers, bandbreedte en interferentie, maar er zijn een aantal slimme manieren om uw netwerk te versterken.

Hoe u kunt downgraden van iOS 17 naar iOS 16 zonder gegevensverlies met Tenorshare Reiboot

Hoe u kunt downgraden van iOS 17 naar iOS 16 zonder gegevensverlies met Tenorshare Reiboot

Als u terug wilt naar de stabiele iOS 16 op uw telefoon, vindt u hier de basisgids voor het verwijderen van iOS 17 en downgraden van iOS 17 naar 16.

Wat gebeurt er met je lichaam als je elke dag yoghurt eet?

Wat gebeurt er met je lichaam als je elke dag yoghurt eet?

Yoghurt is een heerlijk voedingsmiddel. Is het goed om elke dag yoghurt te eten? Hoe verandert je lichaam als je elke dag yoghurt eet? Laten we het samen ontdekken!

Welk type rijst is het beste voor de gezondheid?

Welk type rijst is het beste voor de gezondheid?

In dit artikel worden de meest voedzame rijstsoorten besproken en hoe u de gezondheidsvoordelen van de rijst die u kiest, optimaal kunt benutten.

Hoe word je s ochtends op tijd wakker?

Hoe word je s ochtends op tijd wakker?

Een slaapschema en bedtijdroutine opstellen, uw wekker verzetten en uw dieet aanpassen zijn enkele maatregelen die u kunnen helpen om beter te slapen en 's ochtends op tijd wakker te worden.

Tips voor het spelen van Rent Please! Verhuurder Sim voor beginners

Tips voor het spelen van Rent Please! Verhuurder Sim voor beginners

Huren alstublieft! Landlord Sim is een simulatiespel voor mobiel op iOS en Android. Je speelt als verhuurder van een appartementencomplex en begint met het verhuren van een appartement. Je doel is om het interieur van je appartement te verbeteren en het gereed te maken voor huurders.

De nieuwste badkamertorenverdedigingscodes en hoe u deze invoert

De nieuwste badkamertorenverdedigingscodes en hoe u deze invoert

Ontvang de Roblox-gamecode voor Bathroom Tower Defense en wissel deze in voor geweldige beloningen. Ze helpen je bij het upgraden of ontgrendelen van torens met hogere schade.

Structuur, symbolen en werkingsprincipes van transformatoren

Structuur, symbolen en werkingsprincipes van transformatoren

Laten we op de meest nauwkeurige manier de structuur, symbolen en werkingsprincipes van transformatoren leren kennen.

4 manieren waarop AI smart-tvs beter maakt

4 manieren waarop AI smart-tvs beter maakt

Van betere beeld- en geluidskwaliteit tot spraakbesturing en meer: ​​deze AI-functies maken smart-tv's zoveel beter!

Waarom ChatGPT beter is dan DeepSeek

Waarom ChatGPT beter is dan DeepSeek

Aanvankelijk hadden mensen hoge verwachtingen van DeepSeek. Deze AI-chatbot wordt op de markt gebracht als sterke concurrent van ChatGPT en belooft intelligente chatmogelijkheden en -ervaringen.

Maak kennis met Fireflies.ai: de gratis AI-secretaris die u uren werk bespaart

Maak kennis met Fireflies.ai: de gratis AI-secretaris die u uren werk bespaart

Het is gemakkelijk om belangrijke details te missen wanneer u andere belangrijke zaken opschrijft. Bovendien kan het maken van aantekeningen tijdens een gesprek afleidend werken. Fireflies.ai is de oplossing.

Hoe je een Axolotl in Minecraft grootbrengt en een Minecraft Salamander temt

Hoe je een Axolotl in Minecraft grootbrengt en een Minecraft Salamander temt

Axolot Minecraft is een geweldige assistent voor spelers die onderwater opereren, als ze maar weten hoe ze deze moeten gebruiken.

A Quiet Place: The Road Ahead PC-gameconfiguratie

A Quiet Place: The Road Ahead PC-gameconfiguratie

De configuratie van A Quiet Place: The Road Ahead wordt als zeer positief beoordeeld. Houd hier dus rekening mee voordat u besluit om te downloaden.