OpenAI heeft zojuist officieel een opmerkelijke upgrade geïntroduceerd voor de AI-beeldgeneratiemogelijkheid in ChatGPT, een belangrijke stap voorwaarts in plaats van het gebruik van een afzonderlijk beeldgeneratiemodel zoals bij de vorige DALL-E. Deze nieuwe functie is direct in GPT-4o geïntegreerd, wat aanzienlijke verbeteringen met zich meebrengt.
Het overwinnen van inherente beperkingen
Hoewel veel huidige AI-modellen voor het genereren van afbeeldingen indrukwekkende artistieke afbeeldingen kunnen creëren, hebben ze vaak moeite met elementen als tekst, logo's en alledaagse voorwerpen. OpenAI beweert dat de nieuwe GPT-4o deze beperkingen kan overwinnen dankzij zijn vermogen om:
- Tekst correct weergeven
- Houd u strikt aan de gebruikersvereisten
- Maak gebruik van achtergrondkennis en conversatiecontext
- Maakt het mogelijk om geüploade foto's te bewerken of nieuwe foto's te maken op basis van originele foto's
- Breed beschikbaar
Deze nieuwe functie wordt momenteel uitgerold voor ChatGPT Free, ChatGPT Plus, Pro en Teamgebruikers. In de komende weken zal het ook beschikbaar zijn voor ChatGPT Enterprise en Edu. Opvallend is dat dit de standaardtool voor het maken van afbeeldingen in ChatGPT wordt, waardoor gebruikers er eenvoudig toegang toe hebben zonder dat er extra opties nodig zijn. Gebruikers kunnen foto's aanpassen met:
- Specifieke beeldverhouding
- Exacte kleur (met behulp van hex-code)
- Transparante achtergrond
- Ondersteuning voor meerdere platforms

Naast ChatGPT zal deze functie ook beschikbaar zijn op platforms zoals Sora (afbeeldinggeneratie), de speciale DALL·E GPT en GPT-4o API (voor ontwikkelaars, wordt de komende weken gelanceerd).
Ondanks de belofte van veel verbeteringen kent het nieuwe model nog steeds enkele beperkingen:
- De tijd voor het genereren van de afbeelding kan oplopen tot 1 minuut vanwege de hoge mate van detail
- Ongewenste bijsnijdingen bij verticale foto's
- Soms "fabriceer" je informatie zonder dat er veel context nodig is
- Moeilijkheden bij het verwerken van meer dan 10-20 concepten tegelijk
- Moeilijkheden met niet-Latijnse talen
- Gedetailleerde correcties (zoals spelfouten) zijn niet erg effectief
- Moeilijk om gedetailleerde informatie op kleine formaten weer te geven
Alle door GPT-4o gegenereerde afbeeldingen bevatten C2PA-metadata, waardoor herkomstverificatie met behulp van de interne hulpmiddelen van OpenAI mogelijk is.
Ondanks enkele beperkingen belooft GPT-4o nauwkeurigere en aanpasbare beelden te leveren. OpenAI zegt dat het model de komende maanden verder verbeterd zal worden, waardoor er nieuwe mogelijkheden ontstaan voor het creëren van visuele content op basis van AI.
Met deze belangrijke update versterkt OpenAI haar leidende positie in de creatieve AI-race en biedt het gebruikers op meerdere platforms een naadloze en krachtigere ervaring.