Cerebras lanceert s werelds snelste AI-inferentietechnologie, 20x sneller dan NVIDIA

Cerebras Systems heeft zojuist officieel Cerebras Inference aangekondigd, dat wordt beschouwd als de snelste AI-inferentieoplossing ter wereld. Deze Cerebras Inference levert prestaties tot wel 1.800 tokens per seconde voor Llama 3.1 8B-modellen (8 miljard parameters) en 450 tokens per seconde voor Llama 3.1 70B. Dit is tot wel 20 keer sneller dan NVIDIA GPU-gebaseerde AI-inferentieoplossingen die momenteel beschikbaar zijn in de hyperscale clouds wereldwijd, waaronder Microsoft Azure.

Naast de ongelofelijke prestaties is de serviceprijs van deze nieuwe inferentieoplossing ook nog eens heel laag: een fractie van de prijs van populaire GPU-cloudplatforms. Zo kan een klant bijvoorbeeld een miljoen tokens krijgen voor slechts 10 cent, wat een 100 keer hogere prijs/prestatieverhouding voor AI-workloads oplevert.

De 16-bits precisie van Cerebras en de 20x hogere inferentiesnelheid zorgen ervoor dat ontwikkelaars hoogwaardige AI-toepassingen van de volgende generatie kunnen bouwen zonder dat dit ten koste gaat van de snelheid of de kosten. Deze baanbrekende prijs-/prestatieverhouding wordt mogelijk gemaakt door het Cerebras CS-3-systeem en de AI-processor Wafer Scale Engine 3 (WSE-3). De CS-3 biedt 7.000 keer meer geheugenbandbreedte dan de Nvidia H100 en is daarmee de oplossing voor de technische uitdaging van geheugenbandbreedte voor generatieve AI.

Cerebras lanceert 's werelds snelste AI-inferentietechnologie, 20x sneller dan NVIDIA

Cerebras Inference is momenteel beschikbaar op de volgende drie niveaus:

De Free Tier biedt iedereen die zich aanmeldt gratis API-toegang en ruime gebruikslimieten.
De Developer Tier is ontworpen voor flexibele, serverloze implementaties en biedt gebruikers API-eindpunten voor een fractie van de kosten van bestaande alternatieven op de markt. De Llama 3.1 8B- en 70B-modellen kosten respectievelijk slechts 10 cent en 60 cent per miljoen tokens.
Enterprise Tier-abonnementen bieden verfijnde modellen, op maat gemaakte serviceniveauovereenkomsten en speciale ondersteuning. Ideaal voor aanhoudende workloads: bedrijven kunnen Cerebras Inference benaderen via de door Cerebras beheerde privécloud of on-premises.

Met recordprestaties, concurrerende prijzen en open API-toegang zet Cerebras Inference een nieuwe standaard voor open LLM-ontwikkeling en -implementatie. Cerebras is de enige oplossing die zowel snelle training als gevolgtrekking kan bieden en biedt daarmee geheel nieuwe mogelijkheden voor AI.

Nu AI-trends zich razendsnel ontwikkelen en NVIDIA momenteel een dominante positie in de markt inneemt, signaleert de opkomst van bedrijven als Cerebras en Groq een mogelijke verschuiving in de dynamiek van de gehele sector. Naarmate de vraag naar snellere en kosteneffectievere AI-inferentieoplossingen toeneemt, zijn oplossingen zoals Cerebras Inference goed gepositioneerd om de dominante positie van NVIDIA te bedwingen, met name op het gebied van inferentie.

Tags: #cerebras #ai-inferentietechnologie #nvidia #kunstmatige intelligentie

Hoe krijg ik weer toegang tot de harde schijf? Los de fout op dat de harde schijf niet geopend kan worden.

In dit artikel leggen we je uit hoe je weer toegang krijgt tot je harde schijf als deze kapot is. Laten we het artikel volgen!

Hoe je gespreksbewustzijn en live luisteren op AirPods gebruikt

Op het eerste gezicht lijken AirPods op alle andere echt draadloze oordopjes. Maar dat veranderde allemaal toen een paar onbekende functies werden ontdekt.

Alles over iOS 26

Apple heeft iOS 26 geïntroduceerd: een grote update met een gloednieuw matglasontwerp, slimmere ervaringen en verbeteringen aan bekende apps.

De beste laptops voor studenten in 2025

Studenten hebben een specifiek type laptop nodig voor hun studie. Deze moet niet alleen krachtig genoeg zijn om goed te presteren in hun studierichting, maar ook compact en licht genoeg om de hele dag mee te nemen.

Een printer toevoegen aan Windows 10

Het toevoegen van een printer aan Windows 10 is eenvoudig, hoewel het proces voor bekabelde apparaten anders is dan voor draadloze apparaten.

Hoe u het RAM-geheugen en RAM-fouten op uw computer met de hoogste nauwkeurigheid kunt controleren

Zoals u weet, is RAM een zeer belangrijk hardwareonderdeel van een computer. Het fungeert als geheugen voor de verwerking van gegevens en is de factor die de snelheid van een laptop of pc bepaalt. In het onderstaande artikel laat WebTech360 u zien hoe u met behulp van software in Windows RAM-fouten kunt opsporen.

Verschil tussen gewone tv en smart-tv

Smart-tv's hebben de wereld veroverd. Dankzij zoveel geweldige functies en internetverbinding heeft technologie de manier waarop we televisiekijken veranderd.

Waarom heeft de vriezer geen lampje, maar de koelkast wel?

Koelkasten zijn vertrouwde apparaten in huishoudens. Koelkasten hebben meestal twee compartimenten. Het koelvak is ruim en heeft verlichting die automatisch aangaat wanneer de gebruiker het vak opent. Het vriesvak is smal en heeft geen verlichting.

2 manieren om netwerkcongestie te verhelpen die wifi vertraagt

Wi-Fi-netwerken worden niet alleen beïnvloed door routers, bandbreedte en interferentie, maar er zijn een aantal slimme manieren om uw netwerk te versterken.

Hoe u kunt downgraden van iOS 17 naar iOS 16 zonder gegevensverlies met Tenorshare Reiboot

Als u terug wilt naar de stabiele iOS 16 op uw telefoon, vindt u hier de basisgids voor het verwijderen van iOS 17 en downgraden van iOS 17 naar 16.

Wat gebeurt er met je lichaam als je elke dag yoghurt eet?

Yoghurt is een heerlijk voedingsmiddel. Is het goed om elke dag yoghurt te eten? Hoe verandert je lichaam als je elke dag yoghurt eet? Laten we het samen ontdekken!

Welk type rijst is het beste voor de gezondheid?

In dit artikel worden de meest voedzame rijstsoorten besproken en hoe u de gezondheidsvoordelen van de rijst die u kiest, optimaal kunt benutten.

Hoe word je s ochtends op tijd wakker?

Een slaapschema en bedtijdroutine opstellen, uw wekker verzetten en uw dieet aanpassen zijn enkele maatregelen die u kunnen helpen om beter te slapen en 's ochtends op tijd wakker te worden.

Tips voor het spelen van Rent Please! Verhuurder Sim voor beginners

Huren alstublieft! Landlord Sim is een simulatiespel voor mobiel op iOS en Android. Je speelt als verhuurder van een appartementencomplex en begint met het verhuren van een appartement. Je doel is om het interieur van je appartement te verbeteren en het gereed te maken voor huurders.

De nieuwste badkamertorenverdedigingscodes en hoe u deze invoert

Ontvang de Roblox-gamecode voor Bathroom Tower Defense en wissel deze in voor geweldige beloningen. Ze helpen je bij het upgraden of ontgrendelen van torens met hogere schade.