Abwägung zwischen Modellgenauigkeit und -größe
Die Quantisierung verringert die Modellgröße um das 4-Fache, kann die Genauigkeit jedoch um 3–8 % senken. Wir benchmarken quantisierte gegen vollpräzise Modelle auf der Ziel-Geräteklasse und wählen je Use Case die richtige Abwägung.