Het Chinese technologieconcern Alibaba heeft zojuist een nieuw AI-model aangekondigd, genaamd QVQ-Max uit de Qwen-serie. Dit model betekent een doorbraak op het gebied van multimedia-AI. Het bijzondere aan dit model is dat het beeld-/videomateriaal kan analyseren en op basis van de verkregen informatie argumenten en oplossingen kan formuleren.
Indrukwekkend vermogen
Alibaba beschrijft QVQ-Max als een brug tussen puur tekstgebaseerde AI-modellen en de echte wereld. Dankzij het vermogen tot visueel redeneren kan het systeem:
- Analyseer afbeeldingen en identificeer sleutelelementen
- Veelzijdige toepassing op veel gebieden, van illustratieontwerp en het maken van videoscripts tot rollenspellen
- Problemen oplossen met diagrammen (wiskunde, natuurkunde)
- Stapsgewijze kookinstructies op basis van receptfoto's
Volgens Alibaba helpt het model de kloof te dichten tussen AI's die alleen tekst verwerken en informatie uit de echte wereld. Dankzij zijn visuele redeneringsvermogen kan QVQ-Max de wereld om hem heen 'zien, begrijpen en erover nadenken'. Het bedrijf benadrukt zijn superieure model voor beeldanalyse, waarbij de sleutelelementen worden geïdentificeerd, en zijn flexibiliteit in toepassing op veel gebieden, zoals illustratieontwerp, het maken van videoscripts of rollenspellen.

Net als andere AI-chatbots ondersteunt QVQ-Max werk, opleiding en privéleven. Dankzij de visuele integratie lost het daarnaast ook specifiekere taken op, zoals het oplossen van wiskundige en natuurkundige problemen met behulp van diagrammen en het geven van kookinstructies aan de hand van afbeeldingen van recepten.
Alibaba beschouwt QVQ-Max als de eerste versie en heeft een upgrade-routekaart voor daaropvolgende versies opgesteld. Ten eerste wilden ze de nauwkeurigheid van de beeldherkenning verbeteren met behulp van aardingstechnieken. Ten tweede wordt het model geoptimaliseerd voor multitasking en complexe problemen, zoals het werken met telefoons, computers of het spelen van games. Alibaba is van plan om uiteindelijk de interactie met tekst uit te breiden naar het verifiëren van gereedschappen en het creëren van beeldinhoud.
Gebruikers kunnen QVQ-Max ervaren door:
- Bezoek chat.qwen.ai
- Selecteer het modelmenu in de linkerhoek → " Meer modellen uitvouwen "
- Selecteer QVQ-Max en begin met chatten
- Voeg afbeeldingsbestanden toe om de AI-verwerkingsmogelijkheden te verkennen
Met de lancering van QVQ-Max bevestigt Alibaba opnieuw zijn positie in de race om multimedia-AI te ontwikkelen en concurreert het rechtstreeks met wereldwijde technologiegiganten. Het model belooft praktische toepassingen op het werk, in het onderwijs en in het privéleven.