AI leert mensen voor de gek te houden, ondanks dat ze getraind zijn om eerlijk te zijn

Uit een nieuw onderzoek blijkt dat veel top-AI's, ondanks dat ze zijn getraind om eerlijk te zijn, door training leren te bedriegen en "gebruikers systematisch tot valse overtuigingen aanzetten".

Het onderzoeksteam stond onder leiding van Dr. Peter S. Park, een doctoraalstudent aan het Massachusetts Institute of Technology (MIT) op het gebied van AI-overleving en -veiligheid, en vier andere leden. Tijdens het onderzoek kreeg het team ook advies van vele deskundigen, waaronder Geoffrey Hinton, een van de grondleggers van de ontwikkeling van het vakgebied kunstmatige intelligentie.

AI leert mensen voor de gek te houden, ondanks dat ze getraind zijn om eerlijk te zijn — Illustratie: Medium.

Het onderzoek richtte zich op twee AI-systemen: een algemeen systeem dat is getraind om meerdere taken uit te voeren, zoals GPT-4 van OpenAI ; en systemen die specifiek zijn ontworpen om een specifieke taak uit te voeren, zoals Meta's Cicero.

Deze AI-systemen zijn getraind om eerlijk te zijn, maar tijdens de training leren ze vaak misleidende trucjes om taken uit te voeren, aldus Park.

Uit het onderzoek bleek dat AI-systemen die getraind zijn om ‘spellen met een sociaal element te winnen’, bijzonder geneigd zijn tot misleiding.

Het team probeerde bijvoorbeeld Cicero, getraind door Meta, te laten spelen in Diplomacy, een klassiek strategiespel waarin spelers allianties voor zichzelf moeten smeden en rivaliserende allianties moeten verbreken. Het gevolg is dat deze AI haar bondgenoten vaak verraadt en regelrecht liegt.

Experimenten met GPT-4 lieten zien dat de tool van OpenAI er succesvol in slaagde om een werknemer van TaskRabbit, een bedrijf dat schoonmaakdiensten en meubelmontage aanbiedt, "psychologisch te manipuleren". De werknemer zei dat het in werkelijkheid een mens was die hulp nodig had bij het invoeren van een captcha-code, waarbij hij aangaf dat hij een ernstige visuele beperking had. Deze medewerker hielp OpenAI's AI 'over de grens' te komen, ondanks eerdere twijfels.

Het team van Park citeerde onderzoek van Anthropic, het bedrijf achter Claude AI. Hieruit bleek dat zodra een groot taalmodel (LLM) leert te misleiden, veilige trainingsmethoden nutteloos worden en "moeilijk terug te draaien". De groep is van mening dat dit een zorgwekkend probleem is binnen AI.

De onderzoeksresultaten van het team werden gepubliceerd in Cell Press, een verzameling van toonaangevende multidisciplinaire wetenschappelijke rapporten.

Meta en OpenAI hebben geen commentaar gegeven op de resultaten van dit onderzoek.

Omdat het team vreesde dat kunstmatige-intelligentiesystemen grote risico's met zich mee zouden kunnen brengen, riep het beleidsmakers op om strengere regelgeving voor AI in te voeren.

Volgens het onderzoeksteam is er behoefte aan regelgeving voor AI, moeten modellen met frauduleus gedrag voldoen aan eisen voor risicobeoordeling en moeten AI-systemen en hun uitkomsten strikt worden gecontroleerd. Indien nodig kan het nodig zijn om alle gegevens te verwijderen en opnieuw te trainen.

Laat een reactie achter

Reactie *

Naam *

Website

Hoe houd je Microsoft Teams de hele dag actief en beschikbaar?

Leer hoe je Microsoft Teams de hele dag actief en beschikbaar houdt. Bewezen tips, tools en instellingen om de status 'Afwezig' te voorkomen, je productiviteit te verhogen en geen moment te missen tijdens je werkdag.

Hoe los je afspeelfouten van media in Microsoft Teams op in 2026?

Ben je het zat dat audio-, video- en deelproblemen in Microsoft Teams je vergaderingen in 2026 verstoren? Volg onze deskundige, stapsgewijze handleiding om audio-, video- en deelproblemen snel op te lossen – zonder technische kennis. Naadloze samenwerking is binnen handbereik!

Problemen met de Microsoft Teams Mac-sleutelbos oplossen

Heb je problemen met de sleutelhangers van Microsoft Teams op je Mac? Ontdek bewezen, stapsgewijze oplossingen voor macOS om weer probleemloos samen te werken. Snelle oplossingen vind je hier!

Het probleem oplossen dat je via een directe link deelneemt aan een vergadering in Microsoft Teams

Krijg je problemen met het deelnemen aan een vergadering in Microsoft Teams? Ontdek bewezen stappen om dit op te lossen via directe links. Snelle oplossingen voor probleemloos deelnemen – geen technische kennis vereist!

Problemen met vertraging in Microsoft Teams-videoconferenties via wifi oplossen

Heb je last van vertraging tijdens videoconferenties in Microsoft Teams via wifi? Deze ultieme handleiding voor probleemoplossing biedt snelle oplossingen, geavanceerde tips en wifi-optimalisaties om direct weer kristalheldere videogesprekken te voeren.

Hoe u de cache van Microsoft Teams kunt wissen om prestatieproblemen op te lossen

Ervaart u problemen met een traag Microsoft Teams? Leer stap voor stap hoe u de cache van Microsoft Teams kunt wissen om prestatieproblemen, vertragingen en crashes op te lossen en de snelheid te verhogen op Windows, Mac, via de webbrowser en op mobiele apparaten. Snelle oplossingen die werken!

Hoe los je Microsoft Teams-fout 1200 op je telefoon op (iOS/Android)?

Heb je genoeg van Microsoft Teams-fout 1200 die je telefoongesprekken laat vastlopen? Ontdek snelle, stapsgewijze oplossingen voor iOS en Android, zodat je snel weer probleemloos kunt samenwerken – zonder technische kennis!

Waar bevinden zich de registerinstellingen van Microsoft Teams in Windows 11?

Ontdek de exacte locaties van de Microsoft Teams-registersleutels in Windows 11. Een stapsgewijze handleiding om ze te vinden, te openen en veilig aan te passen voor optimale prestaties en probleemoplossing. Essentieel voor IT-professionals en Teams-enthousiasten.

Waar vind ik de installatiemap van Microsoft Teams op mijn pc?

Kunt u de installatiemap van Microsoft Teams niet vinden op uw pc? Deze stapsgewijze handleiding laat u de exacte paden zien voor nieuwe en klassieke Teams-installaties, per gebruiker en per computer. Bespaar tijd bij het oplossen van problemen!

Hoe los je een aanmeldingsfout bij Microsoft Teams op Chromebooks op?

Heb je problemen met inloggen bij Microsoft Teams op je Chromebook? Ontdek stapsgewijze oplossingen om inlogproblemen snel op te lossen. Wis de cache, update apps en meer voor naadloos samenwerken. Werkt met de nieuwste Chrome OS!