Cerebras lanceert s werelds snelste AI-inferentietechnologie, 20x sneller dan NVIDIA

Cerebras Systems heeft zojuist officieel Cerebras Inference aangekondigd, dat wordt beschouwd als de snelste AI-inferentieoplossing ter wereld. Deze Cerebras Inference levert prestaties tot wel 1.800 tokens per seconde voor Llama 3.1 8B-modellen (8 miljard parameters) en 450 tokens per seconde voor Llama 3.1 70B. Dit is tot wel 20 keer sneller dan NVIDIA GPU-gebaseerde AI-inferentieoplossingen die momenteel beschikbaar zijn in de hyperscale clouds wereldwijd, waaronder Microsoft Azure.

Naast de ongelofelijke prestaties is de serviceprijs van deze nieuwe inferentieoplossing ook nog eens heel laag: een fractie van de prijs van populaire GPU-cloudplatforms. Zo kan een klant bijvoorbeeld een miljoen tokens krijgen voor slechts 10 cent, wat een 100 keer hogere prijs/prestatieverhouding voor AI-workloads oplevert.

De 16-bits precisie van Cerebras en de 20x hogere inferentiesnelheid zorgen ervoor dat ontwikkelaars hoogwaardige AI-toepassingen van de volgende generatie kunnen bouwen zonder dat dit ten koste gaat van de snelheid of de kosten. Deze baanbrekende prijs-/prestatieverhouding wordt mogelijk gemaakt door het Cerebras CS-3-systeem en de AI-processor Wafer Scale Engine 3 (WSE-3). De CS-3 biedt 7.000 keer meer geheugenbandbreedte dan de Nvidia H100 en is daarmee de oplossing voor de technische uitdaging van geheugenbandbreedte voor generatieve AI.

Cerebras lanceert 's werelds snelste AI-inferentietechnologie, 20x sneller dan NVIDIA

Cerebras Inference is momenteel beschikbaar op de volgende drie niveaus:

  • De Free Tier biedt iedereen die zich aanmeldt gratis API-toegang en ruime gebruikslimieten.
  • De Developer Tier is ontworpen voor flexibele, serverloze implementaties en biedt gebruikers API-eindpunten voor een fractie van de kosten van bestaande alternatieven op de markt. De Llama 3.1 8B- en 70B-modellen kosten respectievelijk slechts 10 cent en 60 cent per miljoen tokens.
  • Enterprise Tier-abonnementen bieden verfijnde modellen, op maat gemaakte serviceniveauovereenkomsten en speciale ondersteuning. Ideaal voor aanhoudende workloads: bedrijven kunnen Cerebras Inference benaderen via de door Cerebras beheerde privécloud of on-premises.

Met recordprestaties, concurrerende prijzen en open API-toegang zet Cerebras Inference een nieuwe standaard voor open LLM-ontwikkeling en -implementatie. Cerebras is de enige oplossing die zowel snelle training als gevolgtrekking kan bieden en biedt daarmee geheel nieuwe mogelijkheden voor AI.

Nu AI-trends zich razendsnel ontwikkelen en NVIDIA momenteel een dominante positie in de markt inneemt, signaleert de opkomst van bedrijven als Cerebras en Groq een mogelijke verschuiving in de dynamiek van de gehele sector. Naarmate de vraag naar snellere en kosteneffectievere AI-inferentieoplossingen toeneemt, zijn oplossingen zoals Cerebras Inference goed gepositioneerd om de dominante positie van NVIDIA te bedwingen, met name op het gebied van inferentie.

Sign up and earn $1000 a day ⋙

Leave a Comment

Verschil tussen gewone tv en smart-tv

Verschil tussen gewone tv en smart-tv

Smart-tv's hebben de wereld veroverd. Dankzij zoveel geweldige functies en internetverbinding heeft technologie de manier waarop we televisiekijken veranderd.

Waarom heeft de vriezer geen lampje, maar de koelkast wel?

Waarom heeft de vriezer geen lampje, maar de koelkast wel?

Koelkasten zijn vertrouwde apparaten in huishoudens. Koelkasten hebben meestal twee compartimenten. Het koelvak is ruim en heeft verlichting die automatisch aangaat wanneer de gebruiker het vak opent. Het vriesvak is smal en heeft geen verlichting.

2 manieren om netwerkcongestie te verhelpen die wifi vertraagt

2 manieren om netwerkcongestie te verhelpen die wifi vertraagt

Wi-Fi-netwerken worden niet alleen beïnvloed door routers, bandbreedte en interferentie, maar er zijn een aantal slimme manieren om uw netwerk te versterken.

Hoe u kunt downgraden van iOS 17 naar iOS 16 zonder gegevensverlies met Tenorshare Reiboot

Hoe u kunt downgraden van iOS 17 naar iOS 16 zonder gegevensverlies met Tenorshare Reiboot

Als u terug wilt naar de stabiele iOS 16 op uw telefoon, vindt u hier de basisgids voor het verwijderen van iOS 17 en downgraden van iOS 17 naar 16.

Wat gebeurt er met je lichaam als je elke dag yoghurt eet?

Wat gebeurt er met je lichaam als je elke dag yoghurt eet?

Yoghurt is een heerlijk voedingsmiddel. Is het goed om elke dag yoghurt te eten? Hoe verandert je lichaam als je elke dag yoghurt eet? Laten we het samen ontdekken!

Welk type rijst is het beste voor de gezondheid?

Welk type rijst is het beste voor de gezondheid?

In dit artikel worden de meest voedzame rijstsoorten besproken en hoe u de gezondheidsvoordelen van de rijst die u kiest, optimaal kunt benutten.

Hoe word je s ochtends op tijd wakker?

Hoe word je s ochtends op tijd wakker?

Een slaapschema en bedtijdroutine opstellen, uw wekker verzetten en uw dieet aanpassen zijn enkele maatregelen die u kunnen helpen om beter te slapen en 's ochtends op tijd wakker te worden.

Tips voor het spelen van Rent Please! Verhuurder Sim voor beginners

Tips voor het spelen van Rent Please! Verhuurder Sim voor beginners

Huren alstublieft! Landlord Sim is een simulatiespel voor mobiel op iOS en Android. Je speelt als verhuurder van een appartementencomplex en begint met het verhuren van een appartement. Je doel is om het interieur van je appartement te verbeteren en het gereed te maken voor huurders.

De nieuwste badkamertorenverdedigingscodes en hoe u deze invoert

De nieuwste badkamertorenverdedigingscodes en hoe u deze invoert

Ontvang de Roblox-gamecode voor Bathroom Tower Defense en wissel deze in voor geweldige beloningen. Ze helpen je bij het upgraden of ontgrendelen van torens met hogere schade.

Structuur, symbolen en werkingsprincipes van transformatoren

Structuur, symbolen en werkingsprincipes van transformatoren

Laten we op de meest nauwkeurige manier de structuur, symbolen en werkingsprincipes van transformatoren leren kennen.

4 manieren waarop AI smart-tvs beter maakt

4 manieren waarop AI smart-tvs beter maakt

Van betere beeld- en geluidskwaliteit tot spraakbesturing en meer: ​​deze AI-functies maken smart-tv's zoveel beter!

Waarom ChatGPT beter is dan DeepSeek

Waarom ChatGPT beter is dan DeepSeek

Aanvankelijk hadden mensen hoge verwachtingen van DeepSeek. Deze AI-chatbot wordt op de markt gebracht als sterke concurrent van ChatGPT en belooft intelligente chatmogelijkheden en -ervaringen.

Maak kennis met Fireflies.ai: de gratis AI-secretaris die u uren werk bespaart

Maak kennis met Fireflies.ai: de gratis AI-secretaris die u uren werk bespaart

Het is gemakkelijk om belangrijke details te missen wanneer u andere belangrijke zaken opschrijft. Bovendien kan het maken van aantekeningen tijdens een gesprek afleidend werken. Fireflies.ai is de oplossing.

Hoe je een Axolotl in Minecraft grootbrengt en een Minecraft Salamander temt

Hoe je een Axolotl in Minecraft grootbrengt en een Minecraft Salamander temt

Axolot Minecraft is een geweldige assistent voor spelers die onderwater opereren, als ze maar weten hoe ze deze moeten gebruiken.

A Quiet Place: The Road Ahead PC-gameconfiguratie

A Quiet Place: The Road Ahead PC-gameconfiguratie

De configuratie van A Quiet Place: The Road Ahead wordt als zeer positief beoordeeld. Houd hier dus rekening mee voordat u besluit om te downloaden.