DeepSeek, het Chinese bedrijf achter het gratis AI-model dat de techwereld op zijn kop zette, wordt geconfronteerd met een aantal negatieve beschuldigingen, waaronder het gebruik van gesmokkelde Nvidia GPU's om zijn gelijknamige AI-model te trainen en uit te voeren.
Daarom overweegt het Amerikaanse ministerie van Handel een onderzoek in te stellen naar de vraag of DeepSeek illegaal toegang heeft verkregen tot Nvidia GPU's en deze heeft verzameld via tussenpersonen in Singapore. De afgelopen jaren hebben de Verenigde Staten strenge beperkingen opgelegd aan de export van geavanceerde chips naar China. Daarmee willen ze hun leidende positie op technologisch gebied behouden en de snelle ontwikkeling van hun concurrenten indammen.
DeepSeek kwam onlangs in het nieuws met de release van zijn R1-inferentiemodel. Van dit model wordt gezegd dat de prestaties vergelijkbaar zijn met die van het o1-model van OpenAI, dat alleen beschikbaar is in het ChatGPT Pro-abonnement, waarvoor een betaald abonnement vereist is. Wat DeepSeek zo waardevol maakt, is dat het niet alleen vergelijkbare prestaties levert, maar ook nog eens als open source beschikbaar is en voor iedereen gratis toegankelijk is. Voor degenen die nog nooit de kans hebben gehad om het geavanceerde inferentiemodel van OpenAI te ervaren, is DeepSeek R1 nu een waardig alternatief.
DeepSeek was zo populair dat de app naar nummer één in de hitlijsten van de Amerikaanse App Store steeg. Hierdoor stortte de Amerikaanse aandelenmarkt in en verdween er in een paar dagen tijd 2 biljoen dollar aan marktkapitalisatie.
DeepSeek beweert dat het dit allemaal heeft gedaan met slechts 2.000 Nvidia H800 GPU's en een geschatte investering van 6 miljoen dollar. Dat is een klein bedrag vergeleken met de enorme investeringen in OpenAI en veel andere vergelijkbare AI-modellen.
Volgens Citigroup hebben Amerikaanse technologiegiganten als Microsoft, Meta, Amazon en Alphabet vorig jaar in totaal ongeveer 209 miljard dollar uitgegeven aan data-infrastructuur, waarvan 80% voor datacenters. Hierdoor vragen velen zich af of DeepSeek nu echt iets anders doet dan OpenAI en andere Amerikaanse AI-bedrijven, en of het echt mogelijk is om AI-modellen te trainen met zoveel minder middelen.

David Sacks, een voormalig ambtenaar op het gebied van kunstmatige intelligentie onder president Donald Trump, zei in een recent interview dat er "substantieel bewijs" is dat DeepSeek de output van OpenAI heeft gedistilleerd om zijn eigen model te trainen. Bij dit distillatieproces wordt gebruikgemaakt van een ‘kindermodel’ (DeepSeek) dat de redenering van het ‘oudermodel’ (OpenAI) nabootst. Dit is vergelijkbaar met de manier waarop mensen leren, namelijk door miljoenen vragen te stellen. Microsoft en OpenAI zijn ook een eigen onderzoek gestart naar de kwestie, vooral om te achterhalen of DeepSeek onrechtmatig toegang heeft gehad tot de gegevens van OpenAI.
DeepSeek zegt dat het de H800-chip gebruikt, een AI-chipset die Nvidia speciaal voor de Chinese markt heeft ontwikkeld nadat de exportcontroles voor het eerst werden opgelegd. Het is onduidelijk hoe DeepSeek de Nvidia H800s heeft verworven, maar het bedrijf zou ze eind 2022 of 2023 kunnen kopen.
Er is momenteel geen bewijs dat DeepSeek gebruik maakte van gesmokkelde chips. Maar veel Chinese AI-bedrijven zouden dat wel gedaan hebben. Er is in verschillende landen sprake van georganiseerde smokkel van AI-chips naar China, waaronder Maleisië, Singapore en de Verenigde Arabische Emiraten.