Apple Silicon · <50ms P50 · $2,00 / 1M Token
KI-Inferenz, die in europäischer Hand bleibt — DSGVO-konform, Cloud-Act-frei, Hardware-TEE-gesichert. Kein US-Hyperscaler. Keine schwankenden USD-Preise. Kein Datenverlust. Flacher Tarif: $2,00 pro 1M Token. Knoten in DE, AT und CH. 100 % OpenAI-kompatibel.
Das Problem
Jede Anfrage an AWS Bedrock, Azure OpenAI oder Anthropic passiert Server in den USA. Personenbezogene Daten in Prompts verlassen damit rechtlich die EU. Ein Datenschutz-Audit genügt, um das Projekt zu stoppen.
Ihre Inferenzkosten werden in USD berechnet. Wechselkursschwankungen schlagen direkt auf Ihr Budget durch — ohne dass Sie Volumen oder Modell verändert hätten. Planungssicherheit ist damit strukturell unmöglich.
US-Anbieter unterliegen dem CLOUD Act. Auf richterliche Anordnung müssen sie Daten herausgeben — auch wenn Ihre Daten formal auf EU-Servern liegen. Für Branchen mit Berufsgeheimnis ein rechtliches Minenfeld.
Shared-GPU-Pools großer Anbieter drosseln Ihren Durchsatz, wenn andere Kunden den Pool belasten. Sie zahlen Premium-Preise und bekommen Best-Effort-Kapazität — ohne SLA auf tatsächliche Verfügbarkeit.
Die Lösung
Vier Bausteine, die NOVO von jedem US-Hyperscaler unterscheiden.
Jede Inferenz läuft in einem abgesicherten Hardware Trusted Execution Environment. Prompts, Outputs und Ihre Geschäftslogik sind kryptografisch isoliert — auch für NOVO-Betreiber nicht einsehbar. Ihre IP bleibt Ihre IP.
Inferenz findet ausschließlich auf Hardware in Deutschland, Österreich und der Schweiz statt. Kein Routing über US-Rechenzentren, kein Cloud Act, kein Schrems-III-Risiko. Volle DSGVO-Konformität — dokumentiert und auditierbar.
Der Token-Preis wird beim LOI-Abschluss festgeschrieben. Keine Wechselkurs-Überraschungen, keine nachträglichen Preisanpassungen. Ihr Inference-Budget ist planbar — unabhängig vom USD/EUR-Kurs.
Unified Memory Architecture bedeutet: das Modell lebt im schnellen, dedizierten RAM — kein Shared-GPU-Pool, kein Cold Start, kein Noisy-Neighbour-Effekt. P50 unter 50 ms bei vollem Durchsatz, ohne Throttling.
Für wen NOVO gemacht ist
Kostenvergleich
| Anbieter | NOVO | OpenAI GPT-4o | Anthropic Claude | AWS Bedrock |
|---|---|---|---|---|
| Preis / 1M Token | $2,00 | $15,00 | $15,00 | $8+ |
| P50 Token-Latenz | <50ms | 200ms+ | 200ms+ | 150ms+ |
| OpenAI-kompatible API | ✓ | ✓ | ✗ | ✗ |
| Daten in Europa (DE/AT/CH) | ✓ | ✗ | ✗ | ~ * |
| DSGVO-konform (keine US-Übermittlung) | ✓ | ✗ | ✗ | ✗ |
| Kein Cloud Act | ✓ | ✗ | ✗ | ✗ |
| Fester Preis (kein USD-Risiko) | ✓ | ✗ | ✗ | ✗ |
* Öffentliche Listenpreise Stand Q2 2025. NOVO Flat-Tarif wird beim LOI-Abschluss festgeschrieben. Volumenrabatte auf Anfrage. AWS: EU-Region verfügbar, CLOUD Act gilt dennoch.
Early Access
Sichern Sie Ihren Flat-Tarif und Ihre Kapazitätszuteilung. Wir nutzen die LOI, um Ihr Onboarding zu priorisieren und Compute-Kapazität zu reservieren — damit Sie als Erste live gehen können.
Vielen Dank. Wir haben Ihre digitale LOI erhalten und das unterzeichnete PDF an Ihre E-Mail-Adresse gesendet. Unser Team meldet sich mit einer Kapazitätsreservierung und einem Onboarding-Plan bei Ihnen.