Gem 4 training gebaseerd op kwantisering

Sinds de lancering van Gemma 4 twee maanden geleden, hebben we continu gewerkt aan het uitbreiden van de mogelijkheden ervan. We hebben Multi-Token Prediction (MTP) geïntroduceerd om de inferentie te versnellen, en onlangs hebben we een 12B-model uitgebracht om de kloof tussen onze E4B- en 26B MOE-modellen te overbruggen.

Vandaag introduceren we nieuwe controlepunten die geoptimaliseerd zijn met Quantization-Aware Training (QAT) om Gemma 4 nog efficiënter te maken, zodat modellen lokaal kunnen worden uitgevoerd op edge-apparaten en consumenten-GPU’s. QAT minimaliseert kwaliteitsverlies bij het comprimeren van het model door kwantisering tijdens de training te simuleren. Deze release bevat QAT-controlepunten voor het Q4_0-kwantiseringsformaat en een nieuw kwantiseringsformaat voor mobiel gebruik, wat heeft geleid tot een verminderde geheugenvoetafdruk van de Gemma 4 E2B tot 1 GB.

Kwantisering is essentieel voor het uitvoeren van modellen op consumentenhardware door de geheugenvoetafdruk te verkleinen en de decoderingssnelheid te verhogen. QAT integreert het kwantiseringsproces rechtstreeks in de training, in plaats van het model na de training te kwantiseren zoals bij standaard post-training kwantisering (PTQ). Onze QAT-resultaten behouden een hogere algehele kwaliteit dan standaard PTQ-basislijnen.

We hebben het QAT-recept toegepast op het Q4_0-formaat om de prestaties van alle modellen te maximaliseren. Voor de edge-modellen (E2B en E4B) hebben we een speciaal kwantiseringsschema ontwikkeld dat is geoptimaliseerd voor mobiele apparaten.

Met deze nieuwe aanpak kunnen gebruikers besparen op VRAM en opslagruimte bij het uitvoeren van modellen. Gemma 4 blijft de kwaliteit en mogelijkheden bieden die gebruikers verwachten, terwijl de geheugenvereisten dramatisch worden verminderd.

BRON

Paul Arends

Paul Arends

“Ik ben Paul Arends, afgestudeerd in Bedrijfskunde aan de Universidad Complutense en met een master in Personeelsmanagement en Organisatieontwikkeling aan ESIC. Ik ben geïnteresseerd in netwerken en social media en richt mijn professionele ontwikkeling op talentmanagement en organisatieverandering.”

Verwante vermeldingen

Google AI-aankondigingen vanaf mei 2026

Verken de mogelijkheden van Gemini 3.5. Onze nieuwste serie modellen combineert grensverleggende intelligentie met actie. Met krachtige nieuwe actie-implementatiemogelijkheden is Gemini 3.5 ontworpen om u te helpen complexe, uit meerdere…

Google en Utah State Board of Education samen voor Gemini-tools

Vandaag kondigen we een nieuw partnerschap aan met de Utah State Board of Education (USBE) om toegang te bieden tot Gemini for Education voor elke basisschool tot en met 12…

Geef een reactie

Je e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *

Ben je verdwaald?

Gem 4 training gebaseerd op kwantisering

Gem 4 training gebaseerd op kwantisering

Google AI-aankondigingen vanaf mei 2026

Google AI-aankondigingen vanaf mei 2026

Google en Utah State Board of Education samen voor Gemini-tools

Google en Utah State Board of Education samen voor Gemini-tools

Bouw Kaggle-benchmarks lokaal

Bouw Kaggle-benchmarks lokaal

Profiel voor uitgevers en makers om werk te promoten in Zoeken

Profiel voor uitgevers en makers om werk te promoten in Zoeken

Nieuwe kansen voor generatieve media bij startups

Nieuwe kansen voor generatieve media bij startups