Zum Inhalt springen

Core ML Vision Neural Engine On-Device

Core-ML-Entwicklung für On-Device-KI auf iPhone und iPad

Maschinelles Lernen, das vollständig auf dem Gerät läuft — keine Daten verlassen das iPhone. Bildklassifizierung mit dem Vision-Framework, NLP-basierte Textanalyse und personalisierte Empfehlungsmodelle, kompiliert für die Apple Neural Engine. Datenschutzfreundlich by Design, offline-fähig und nicht von nativer iOS-Performance zu unterscheiden.

Angebot anfordern Fallstudien ansehen

Wir integrieren Core-ML-Modelle in iOS- und iPadOS-Apps für Kunden aus den Bereichen Gesundheit, Fitness, Recht und Consumer — Inferenz, die auf der Neural Engine mit Sub-Millisekunden-Latenz und ohne Netzwerk-Roundtrip läuft. Wir konvertieren PyTorch- und TensorFlow-Modelle mit coremltools ins Core-ML-Format, quantisieren für Größe und Geschwindigkeit und validieren die Genauigkeits-Übereinstimmung vor dem Release. Wenn ein Modell kontinuierliche Verbesserung erfordert, implementieren wir On-Device-Feedbackschleifen für das Fine-Tuning, ohne Rohdaten an einen Server zu senden.

Herausforderungen

Branchenherausforderungen, die wir lösen

Abwägung zwischen Modellgenauigkeit und -größe

Die Quantisierung verringert die Modellgröße um das 4-Fache, kann die Genauigkeit jedoch um 3–8 % senken. Wir benchmarken quantisierte gegen vollpräzise Modelle auf der Ziel-Geräteklasse und wählen je Use Case die richtige Abwägung.

Versionsübergreifende Core-ML-Kompatibilität

Für die iOS-17-Neural-Engine kompilierte Modelle können sich unter iOS 15 anders verhalten. Wir testen über den gesamten Zielbereich und steuern Funktionen explizit über Versions-Gating.

Inferenz-Latenz auf älterer Hardware

Die A14 Neural Engine ist 5-mal schneller als die A11. Wir profilieren auf der mindestens unterstützten Hardware und greifen auf CPU-Ausführung zurück, wo die Latenz nicht akzeptabel ist.

Konvertierung von PyTorch-/TensorFlow-Modellen

Von coremltools nicht unterstützte benutzerdefinierte Layer erfordern eigene MIL-Operationen. Wir bilden nicht unterstützte Ops auf äquivalente Core-ML-Primitive ab und validieren sie numerisch.

Datenschutz-Compliance auf dem Gerät

Auch On-Device-ML darf biometrische Daten nicht ohne ausdrückliche Einwilligung gemäß DSGVO und HIPAA verarbeiten. Wir konzipieren die Inferenz-Pipeline rund um Datenminimierung.

Modell-Updates ohne App-Store-Prüfung

Das Aktualisieren eines mitgelieferten Modells erfordert ein vollständiges App-Release. Wir implementieren Hintergrund-Modell-Download mit Versions-Gating für unkritische Updates und eine App-Store-Einreichung für Modelländerungen, die Datenschutzangaben betreffen.

Lösungen

Lösungen, die wir entwickeln

Bildklassifizierung und Objekterkennung

Vision-Framework-Pipelines für medizinische Bildgebung, Produkterkennung im Handel, Dokumentenscan und Augmented-Reality-Überlagerungen.

Verarbeitung natürlicher Sprache

On-Device-NLP für Content-Moderation, Stimmungsanalyse, automatisches Tagging und intelligente Suche — kein Text verlässt das Gerät.

Personalisierte Empfehlungen

Nutzerverhaltensmodelle, die sich auf dem Gerät anpassen — für Inhalts-, Produkt- und Aktivitätsempfehlungen ohne Server-Roundtrip.

KI für Gesundheit und Fitness

HealthKit-integrierte Modelle für Aktivitätserkennung, Kalorienschätzung und Anomalieerkennung — HIPAA-fähig by Design.

Modellkonvertierung und -optimierung

Konvertierung von PyTorch- und TensorFlow-Modellen ins Core-ML-Format, INT8/FP16-Quantisierung und Neural-Engine-Kompilierung.

Föderiertes und On-Device-Lernen

Feedbackschleifen, die das Modell aus Nutzerinteraktionen verbessern, ohne dass Rohdaten das Gerät verlassen — datenschutzfreundliches Training.

Stack

Technologie-Stack

Core ML, Create ML, coremltools, Vision, Natural Language, CoreMotion, HealthKit, Swift, Python (Modellkonvertierung), PyTorch, TensorFlow.

Compliance

Compliance & Regulierung

DSGVO-konform · HIPAA-fähig · Apple Privacy Manifest · On-Device-Verarbeitung

EU

  • DSGVO — On-Device-Verarbeitung, Datenminimierung, PrivacyInfo.xcprivacy.
  • EAA — barrierefreie ML-Ausgaben (Alternativtexte, Audiobeschreibungen).
  • EU-KI-Verordnung — Risikoklassifizierung und Transparenz für KI-Funktionen.
  • MDR — Bereitschaft zur Medizinprodukteverordnung für diagnostische KI.

USA

  • HIPAA — On-Device-Verarbeitung von Gesundheitsdaten, keine ePHI außerhalb des Geräts.
  • CCPA/CPRA — abgeleitete Daten als personenbezogene Informationen gemäß CCPA.
  • FDA 21 CFR Part 11 — elektronische Aufzeichnungen für diagnostische KI.
  • COPPA — Altersfreigabe für Apps, die Bilder von Kindern verarbeiten.

Warum YuSMP

Warum Teams für On-Device-KI auf YuSMP setzen

Durchgängige ML-Pipeline

Wir übernehmen den gesamten Weg: Modelltraining, coremltools-Konvertierung, Neural-Engine-Optimierung und iOS-Integration — ein Team, keine Übergabelücken.

Privacy-First by Design

On-Device-Inferenz bedeutet, dass Nutzerdaten das Gerät nie verlassen. Wir konzipieren die Pipeline ab dem ersten Sprint auf DSGVO und HIPAA hin.

Genauigkeitsvalidierung für die Produktion

Wir liefern erst aus, wenn die Genauigkeit des quantisierten Modells innerhalb der vereinbarten Toleranz mit der Python-Baseline auf der realen Geräteklasse übereinstimmt, für die Sie ausliefern.

FAQ

Core ML FAQ

Können Sie unser PyTorch- oder TensorFlow-Modell in Core ML konvertieren?

Ja. Wir verwenden coremltools, um PyTorch- (über TorchScript) und TensorFlow/Keras-Modelle zu konvertieren, bilden benutzerdefinierte Layer auf MIL-Operationen ab und validieren die numerische Übereinstimmung zwischen Quell- und konvertiertem Modell.

Wie stark beeinflusst die Quantisierung die Genauigkeit?

INT8-Quantisierung reduziert die Genauigkeit bei Vision-Aufgaben in der Regel um 1–5 % und bei NLP um 2–8 %, während sich die Modellgröße um das 4-Fache und die Inferenzzeit um das 2- bis 3-Fache verringert. Wir benchmarken auf Ihrer Ziel-Geräteklasse und wählen das Quantisierungsniveau, das Ihr Genauigkeits-SLA erfüllt.

Kann das Modell ohne erneute App-Store-Einreichung aktualisiert werden?

Bei Modellen, die keine Datenschutzangaben betreffen, ja — wir implementieren Hintergrund-Download mit Versions-Gating. Modelländerungen, die eine neue API-Nutzung einführen, erfordern ein App-Store-Update mit aktualisierter PrivacyInfo.xcprivacy.

Wie hoch ist die Latenz auf älteren iPhones?

Eine A14 Neural Engine führt eine MobileNet-V3-Inferenz in ~0,4 ms aus. Eine A11 (iPhone 8) benötigt ~3 ms. Wir profilieren auf der von Ihnen mindestens unterstützten Hardware und konzipieren CPU-Fallback-Pfade, wo die Latenz nicht akzeptabel ist.

Können Core-ML-Modelle offline laufen?

Ja — das ist der zentrale Vorteil. Die Modelle werden mit der App ausgeliefert oder einmalig heruntergeladen und zwischengespeichert. Die Inferenz benötigt keine Netzwerkverbindung.

Wie gehen Sie bei On-Device-ML mit der DSGVO um?

On-Device-Verarbeitung bedeutet, dass Rohdaten das Gerät nicht verlassen. Für die Erfassung abgeleiteter Ergebnisse benötigen wir dennoch eine Rechtsgrundlage (in der Regel berechtigtes Interesse oder Einwilligung) und dokumentieren die Datenflüsse in der PrivacyInfo.xcprivacy.

Nutzen Sie Create ML oder eigenes Python-Training?

Create ML für gängige Klassifizierungs- und Tabellen-Aufgaben, bei denen Apples Trainings-UX ausreicht. Eigenes PyTorch-Training für komplexe Architekturen, das Fine-Tuning vortrainierter Modelle oder Aufgaben, bei denen die Trainingsdaten besondere Behandlung erfordern.

On-Device-KI für Ihre iOS-App mit erfahrenen Core-ML-Entwicklern

Antwort innerhalb von 1 Werktag. NDA auf Anfrage.

Angebot anfordern