Stand Juni 2026

Die wichtigsten KI-Modelle 2026 — im Überblick

Eine umfassende, verständliche Übersicht der relevantesten Sprach-/Code-Modelle und Videomodelle: was sie können, was sie kosten, wie sie abschneiden — und welche generell DSGVO-konform nutzbar sind. Oben links zwischen Einfach und Technisch umschaltbar.

Kurzfassung: Beim Preis-Leistungs-Verhältnis führen 2026 die offenen China-Modelle (DeepSeek, GLM, Qwen, Kimi). Die US-Modelle (Claude, GPT, Gemini, Grok) sind an der Spitze und sehr zuverlässig, aber Closed, teurer und nicht selbst hostbar. Für Datenhoheit zählen die in DE gehosteten IONOS-Modelle und — als Ziel — offene Modelle im EU-Self-Hosting.

▦ Modell-Landkarte

Alle aktuellen Modelle auf einen Blick — Leistung gegen Preis, Farbe nach Herkunft, Ring nach DSGVO-Status. Beschriftet sind die Stärksten und die besten Preis-Leistungs-Modelle; für alle anderen über den Punkt fahren.

Modell-Landkarte lädt …

i So liest du die Karten

✅ Gut für / ⛔ Weniger geeignet

Stärken und ehrliche Grenzen jedes Modells in einfacher Sprache.

📊 KI-Index

Farbiger Balken = grobe Leistung (Artificial-Analysis-Index, 0–65). Details im Bereich „Benchmarks & Quellen“.

🟢🟡🔴 Kosten-Ampel

grün = günstig, gelb = mittel, rot = teuer. Genaue Preise im Technik-Modus.

🇪🇺 DSGVO-Status

Grün = jetzt EU-konform (IONOS), Gelb = per EU-Hosting machbar, Rot = nicht konform (Closed).

Sprach- & Code-Modelle

Alle LLMs

Die wichtigsten Sprach- und Code-Modelle 2026. Filtere nach Herkunft oder Anwendung; schalte auf Technisch für Kontext, Lizenz und genaue Preise.

Farben des KI-Index: ■ Spitze · ■ sehr stark · ■ stark · ■ solide · ■ älter. Werte teils gerundet/geschätzt — Methodik & Quellen im eigenen Bereich.

Datenhoheit

DSGVO-konform — welche Modelle, wenn man welche will?

DSGVO-Konformität hängt weniger vom Modell ab als davon, wo es läuft und unter welchem Vertrag. Fast jedes Modell lässt sich konform nutzen — über den richtigen Weg. Hier die drei Wege plus die nötigen Bausteine.

Kein Rechtsrat: technische Orientierung, keine Rechtsberatung. Die konkrete Konformität (AVV, Datenkategorien, Transfer-Folgenabschätzung) bitte mit Datenschutzbeauftragten/Rechtsabteilung klären.

🟢 Weg 1: EU-Anbieter — Daten bleiben in der EU

am einfachsten

Anbieter, die unter EU-Recht firmieren und in der EU verarbeiten — außerhalb der Reichweite des US CLOUD Act, direkt konform nutzbar (mit AVV). Das ist der sauberste Weg.

IONOS AI Model Hub DE

gpt-oss, Qwen3-Coder, Mistral Small, Llama, FLUX, OCR · ISO 27001, BSI C5, Gaia-X

Mistral AI FR

Eigene API + „Le Chat“ Enterprise, EU-Datenresidenz; offene Apache-2.0-Modelle

Aleph Alpha DE

Souveräne Enterprise-KI, On-Prem/EU — für regulierte Branchen & Behörden

openhippo.ai DE

Hosting offener Modelle in Deutschland (Cloud oder On-Prem)

Souveräne Clouds EU

OVHcloud (FR), Scaleway (FR), STACKIT / T-Systems (DE) — EU-Rechenzentren für KI

🟢 Weg 2: Open-Weight selbst in der EU hosten

volle Kontrolle

Offene Modelle auf eigener Hardware oder in einer EU-Cloud (EU-Anbieter) betreiben — die Daten verlassen die EU nie und liegen außerhalb des US CLOUD Act. Volle Kontrolle.

DeepSeek · GLM · Qwen · Kimi China, open

Open-Weight (MIT/Apache/Mod-MIT) → in der EU hostbar, dann DSGVO-konform

Mistral · Llama · gpt-oss EU/US, open

Offen → EU-Self-Hosting ohne Datenabfluss

DeepSeek-TNG R1T2 Chimera DE, open

Deutsches Open-Weight-Modell, ideal fürs EU-Hosting

🟡 Weg 3: US-Frontier über EU-Region + Vertrag (bedingt)

mit Auflagen

Die stärksten Closed-Modelle lassen sich in einer EU-Region mit Auftragsverarbeitungsvertrag und Zero-Retention betreiben. Aber: EU-Datenresidenz senkt das Risiko — sie beseitigt es nicht (siehe Kasten unten).

⚠ Der Haken: US CLOUD Act. US-Anbieter können — auch über ihre EU-Regionen und eigenen „Sovereign Clouds“ — per CLOUD Act (2018) und FISA 702 von US-Behörden gezwungen werden, Daten herauszugeben, selbst wenn diese in der EU liegen. Das ist der Kern von Schrems II: Verträge (SCCs/DPF) und EU-Residenz reduzieren den Zugriff, heben ihn rechtlich aber nicht auf. EU-Kommission, EDSA und das EU-Cloud-Sovereignty-Framework (Okt. 2025) behandeln US-kontrollierte Anbieter deshalb als Rest-Transferrisiko, das Vertragsklauseln allein nicht ausräumen.

⚠ Wichtige Warnung — häufiger Irrtum: Genau dieser Punkt wird in der Praxis regelmäßig missverstanden und falsch gehandhabt. Der verbreitetste Fehler: „EU-Region = DSGVO-sicher“ — und damit gilt die Prüfung als erledigt. Das ist falsch. Die EU-Region bestimmt nur den Speicherort, nicht den rechtlichen Zugriff. Ebenso wird oft angenommen, die „Sovereign Cloud“ eines US-Anbieters sei automatisch CLOUD-Act-immun — auch das trifft nicht zu, solange ein US-Mutterkonzern dahintersteht. Konsequenz: EU-Datenresidenz ohne AVV, ohne eigene Schlüssel (BYOK/HYOK) und ohne dokumentierte Risikobewertung ist keine belastbare DSGVO-Konformität für personenbezogene Daten — auch wenn sie häufig genau so verkauft und eingesetzt wird.

Azure OpenAI „Data Zone (EUR)“ GPT-5.5

GPT in der EU (EU Data Boundary), Zero-Retention möglich · US-Konzern → CLOUD-Act-Restrisiko

Amazon Bedrock EU Claude

Claude mit EU-Datenresidenz (Frankfurt), kein Routing zu Anthropic-US · US-Konzern → CLOUD-Act-Restrisiko

Google Vertex AI (Europe-West) Gemini & Claude

Gemini & Claude in EU-Region, Zero Data Retention · US-Konzern → CLOUD-Act-Restrisiko

„Sovereign Clouds“ (US-betrieben) umstritten

AWS European Sovereign Cloud (DE, seit 01/2026), MS Delos/Bleu — EU-Betrieb, aber US-Mutterkonzern → CLOUD-Act-Immunität rechtlich umstritten

OpenAI / Anthropic direkt Hinweis

OpenAI: EU-Datenresidenz verfügbar. Anthropic direkt nur US/global → EU über Bedrock/Vertex

Voraussetzungen & Risikominderung: EU-Region gepinnt · AVV/DPA + SCCs · Zero-Retention / kein Training · DPF-Zertifizierung · Transfer-Folgenabschätzung (TIA). CLOUD-Act-Risiko technisch mindern: Verschlüsselung mit eigenen, in der EU gehaltenen Schlüsseln (BYOK/HYOK) — kann der Anbieter die Schlüssel nicht einsehen, kann er auch keine lesbaren Daten herausgeben („technische Unmöglichkeit“). Für streng vertrauliche oder personenbezogene Daten gilt trotzdem: echte Souveränität nur über Weg 1 (EU-Anbieter) oder Weg 2 (Self-Hosting).

⚠ Sovereignty Washing — die häufigen Irreführungen

„Sovereignty Washing“ bezeichnet, wenn ein Dienst europäische Souveränität vortäuscht, obwohl versteckte US-Abhängigkeiten bleiben — meist, indem Datenresidenz (wo Daten liegen) als Datensouveränität (wer rechtlich Kontrolle/Zugriff hat) verkauft wird. Der EU-Cloud-Verband CISPE warnt, dass dies sogar in EU-Regularien einzusickern droht.

Residenz ≠ Souveränität Muster

„Data residency“ (Speicherort EU) wird als „data sovereignty“ (rechtliche Kontrolle) vermarktet — zwei verschiedene Dinge.

US-eigene „Sovereign Cloud“ Muster

Separate EU-Einheit, EU-Personal, eigenes Billing — aber US-Mutterkonzern → CLOUD Act greift weiter (AWS ESC, MS Sovereign Cloud).

„Trusted“ / JV-Clouds Muster

EU-Marke auf US-Technik: S3NS (Thales + Google), Bleu (Orange/Capgemini + Microsoft), Delos (SAP + Microsoft). CISPE nennt die S3NS-Anerkennung „institutionalisiertes Sovereignty Washing“.

EU-Label, US-Backend Muster

Europäisch gebrandete SaaS-Tools, die im Hintergrund auf US-kontrollierten Diensten speichern.

Belege aus der Praxis: Microsoft konnte vor dem französischen Senat (2025) nicht garantieren, dass Daten französischer Bürger ohne Zustimmung französischer Behörden nicht an US-Stellen gehen. Nextcloud-Gründer Frank Karlitschek nennt Microsofts jüngste „Souveränitäts“-Offensive offen „Sovereignty Washing“. CISPEs Faustregel: Souveränität bemisst sich an Kontrolle — nicht an bloßer EU-Präsenz. (US-Hyperscaler halten ~70 % des EU-Cloud-Markts, EU-Anbieter nur ~15 %.)

Woran man echte Souveränität erkennt: Anbieter, der unter EU-Recht firmiert und nicht von einem US-Konzern kontrolliert wird · keine US-Mutter- oder JV-Konstruktion · EU-Gerichtsbarkeit · idealerweise eigene bzw. kundengehaltene Schlüssel. „EU-Region“, „EU-Personal“ oder „separate Einheit“ allein genügen nicht.

🔴 Eher kritisch — ohne Zusatzmaßnahmen meiden

China-Direkt-APIs Risiko

MiniMax, ERNIE, Qwen-Max, DeepSeek über China-API — Daten in China, kein DPF

Consumer-Apps ohne Vertrag Risiko

ChatGPT/Gemini Free/Plus ohne Enterprise-AVV — mögliche Trainingsnutzung

✓ Bausteine der Konformität

EU-Datenresidenz

Verarbeitung in einer EU-Region; Daten verlassen die EU nicht.

AVV / DPA + SCCs

Auftragsverarbeitungsvertrag, bei US-Bezug zusätzlich Standardvertragsklauseln.

Zero-Retention / kein Training

Eingaben werden nicht gespeichert und nicht zum Training genutzt.

DPF-Zertifizierung

EU-US Data Privacy Framework als Grundlage für US-Transfers (aktiv, gerichtlich bestätigt 2025).

TIA & TOMs

Transfer-Folgenabschätzung plus technisch-organisatorische Maßnahmen.

EU AI Act

Wesentliche Pflichten gelten ab 2. August 2026 — zusätzlich zur DSGVO beachten.

CLOUD Act beachten

US-Anbieter sind trotz EU-Region nicht CLOUD-Act-immun. Echte Immunität nur bei EU-Anbietern, Self-Hosting oder eigenen Schlüsseln (BYOK/HYOK).

🏢 DSGVO-Einordnung pro Modell

Die Modelle dieser Übersicht nach DSGVO-Status — was per EU-Hosting (z. B. IONOS) schon heute konform läuft, was per Self-Hosting machbar ist und was Closed bleibt:

Jetzt nutzbar: über das IONOS AI Model Hub (DE) gehostet — sofort DSGVO-konform.

🟢 Jetzt DSGVO-konform (IONOS, DE)

Ziel: die offenen Top-Modelle (v. a. China) per EU-Self-Hosting (IONOS/openhippo) anbieten — dann ebenfalls konform.

🟡 EU-fähig per Self-Hosting (Open-Weight)

Nur zum Evaluieren: Closed-Modelle (US/China) — nicht für Kundendaten.

🔴 Nicht DSGVO-konform (Closed)

Kurz: Für echte Datensouveränität führen Weg 1 (EU-Anbieter) und Weg 2 (Self-Hosting) — beide liegen außerhalb des US CLOUD Act. Weg 3 (US-Frontier in EU-Region) ist praktikabel und mit AVV/DPF zulässig, trägt aber ein CLOUD-Act-Restrisiko. Faustregel: je sensibler bzw. personenbezogener die Daten, desto eher Weg 1 oder 2 — oder zumindest eigene Schlüssel (BYOK/HYOK).

Text-zu-Video

Videomodelle

Videomodelle sind eine eigene Modellklasse (Diffusion/DiT) — kein Sprach-LLM erzeugt Video. Der Markt ist 2026 „multipolar“: je nach Budget, Qualität, Ton, Lizenz und Self-Hosting-Wunsch gibt es andere Sieger.

Wichtig: OpenAI Sora 2 ist eingestellt (Web/App seit 26.04.2026, API-Ende 24.09.2026) — nicht mehr einplanen. Für DSGVO/EU eignen sich die offenen Modelle (LTX, Wan, HunyuanVideo), da selbst in der EU hostbar.

Arena-Elo stammt aus der Artificial Analysis Video Arena (Blindvergleiche, höher = besser). Modelle ohne Elo sind anders positioniert (z. B. kreative Kontrolle).

Methodik

Benchmarks & Quellen

Womit die Leistungswerte belegt sind und wie der KI-Index zu lesen ist — damit die Vergleiche nachvollziehbar bleiben.

1 Was der „KI-Index“ bedeutet

Der KI-Index-Balken orientiert sich am Artificial Analysis Intelligence Index v4.1 (veröffentlicht 16.06.2026) — einem zusammengesetzten Wert aus neun Tests: GDPval-AA v2, τ³-Bench Banking, Terminal-Bench v2.1, SciCode, AA-LCR, AA-Omniscience, Humanity’s Last Exam, GPQA Diamond und CritPt. v4.1 gewichtet agentische Aufgaben stärker (Terminal-Bench Hard → v2.1, τ²-Telecom → τ³-Banking, IFBench entfiel) — die Werte fallen daher durchweg niedriger aus als unter v4.0. Ein einzelner Wert pro Modell macht sehr unterschiedliche Modelle grob vergleichbar. Skala hier ~0–61 (aktuelle Spitze: Claude Opus 5 mit 61). Quelle direkt: artificialanalysis.ai/models ↗ (abgerufen 19.06.2026, Claude Opus 5 ergänzt 28.07.2026, Index v4.1).

Verifiziert vs. geschätzt: Direkt aus der Quelle stammen u. a. Claude Opus 5 (61), Claude Fable 5 (60), GPT-5.6 Sol (59), Kimi K3 (57), Claude Opus 4.8 (56), GPT-5.5 (55), GPT-5.6 Terra (55), Grok 4.5 (54), Claude Sonnet 5 (53), GPT-5.6 Luna (51), GLM-5.2 (51), Gemini 3.5 Flash (50) — Stand AA-Index v4.1. Übrige Werte sind gerundete Schätzungen zur groben Einordnung und im Technik-Modus als „ca.“ erkennbar. Modellstatus: Karten mit dem Hinweis „Vorgänger“ oder „Historische Referenz“ zeigen abgelöste Modelle — sie stehen zur Einordnung hier, sind aber nicht die aktuelle Wahl.

Warum schneidet Mistral Large 3 mit 23 so niedrig ab? Large 3 ist ein Non-Reasoning-Modell — es antwortet direkt, ohne ausgedehntes Mitdenken. Der v4-Index besteht aber überwiegend aus Reasoning- und Agentik-Tests (Terminal-Bench, GDPval, GPQA, Humanity’s Last Exam …), bei denen Denkmodelle systematisch vorne liegen. Artificial Analysis führt Large 3 zudem auch innerhalb der offenen Non-Reasoning-Klasse unterdurchschnittlich. Zur Einordnung: Schreibqualität, EU-Datenhoheit und die freie Apache-Lizenz misst der Index nicht — und fürs Schlussfolgern ist bei Mistral derzeit Medium 3.5 (Index 39) die stärkere Wahl. Beleg: artificialanalysis.ai/models/mistral-large-3 ↗

2 Quellen zum Nachschlagen

Artificial Analysis

Intelligence Index (LLMs) + Video Arena (Elo). Hauptquelle dieser Übersicht.

artificialanalysis.ai ↗

LMArena

Blind-Vergleiche durch Nutzer (Elo) für Chat, Coding, Vision, Search.

lmarena.ai ↗

BenchLM

Aggregierte Leaderboards inkl. China-Modelle und Provisional-Rankings.

benchlm.ai ↗

LLM-Stats

Vergleich von 300+ Modellen nach Intelligenz, Tempo, Preis.

llm-stats.com ↗

SWE-Bench

Coding-Benchmark: Anteil real gelöster Software-Aufgaben.

swebench.com ↗

Hugging Face

Offizielle Model Cards (Lizenz, Größe, Benchmarks) der Anbieter.

huggingface.co ↗

Hinweis: Benchmarks sind Momentaufnahmen und je nach Testaufbau unterschiedlich. Diese Übersicht dient der groben Orientierung, nicht als exakte Rangliste. Für Entscheidungen die verlinkten Originalquellen prüfen.

Glossar

Begriffe erklärt

Die wichtigsten Wörter aus den Karten — je in einem Satz.

KI-Index: Grober Gesamt-Leistungswert (Artificial Analysis Intelligence Index), der viele Tests zu einer Zahl bündelt. Höher = fähiger.
Arena-Elo: Bewertung aus Blindvergleichen: Nutzer wählen zwischen zwei Ergebnissen, ohne das Modell zu kennen. Höhere Elo = häufiger bevorzugt.
Kontextlänge: Wie viel Text das Modell auf einmal „im Kopf“ behält. 1 Mio. Tokens ≈ ganze Bücher oder Code-Projekte.
Token: Wortbaustein, in dem Länge und Preis gerechnet werden — grob 1.000 Tokens ≈ 750 Wörter.
Multimodal: Das Modell versteht nicht nur Text, sondern auch Bilder (manche auch Audio/Video).
Open-Weight: Die Modellgewichte sind frei verfügbar — selbst hostbar, auch in der EU. Closed = nur über die fremde API nutzbar.
DSGVO-konform: Verarbeitung datenschutzkonform in der EU. Erreichbar über EU-Hosting (z. B. IONOS) oder eigenes EU-Self-Hosting offener Modelle.
Self-Hosting: Modell auf eigenen/gemieteten Servern betreiben — volle Datenkontrolle, braucht passende Hardware (GPU).
Lizenz: Nutzungsbedingungen. Apache 2.0 / MIT = sehr frei, kommerziell ok. „Nicht-kommerziell“ = im Geschäft nur mit Genehmigung.
MoE (Mixture of Experts): Großes Modell, das pro Anfrage nur einen Teil seiner „Experten“ aktiviert — viel Wissen bei moderater Rechenlast.
Datenresidenz vs. Datensouveränität: Residenz = wo Daten liegen (z. B. EU-Region). Souveränität = wer rechtlich Kontrolle/Zugriff hat. US-Residenz ≠ Souveränität, solange US-Recht (CLOUD Act) greift.
Sovereignty Washing: Marketing, das EU-Souveränität vortäuscht (z. B. „Data residency“ als „Souveränität“), obwohl US-Kontrolle bzw. CLOUD-Act-Zugriff bestehen bleiben.
CLOUD Act: US-Gesetz (2018): verpflichtet US-kontrollierte Anbieter, Daten an US-Behörden herauszugeben — auch wenn sie in der EU liegen.
BYOK / HYOK: Eigene Verschlüsselungs-Schlüssel (in der EU gehalten). Kann der Anbieter sie nicht einsehen, kann er keine lesbaren Daten herausgeben.

KI-Modelle 2026 — Übersicht

▦ Modell-Landkarte

i So liest du die Karten

✅ Gut für / ⛔ Weniger geeignet

📊 KI-Index

🟢🟡🔴 Kosten-Ampel

🇪🇺 DSGVO-Status

🟢 Weg 1: EU-Anbieter — Daten bleiben in der EU

🟢 Weg 2: Open-Weight selbst in der EU hosten

🟡 Weg 3: US-Frontier über EU-Region + Vertrag (bedingt)

⚠ Sovereignty Washing — die häufigen Irreführungen

🔴 Eher kritisch — ohne Zusatzmaßnahmen meiden

✓ Bausteine der Konformität

EU-Datenresidenz

AVV / DPA + SCCs

Zero-Retention / kein Training

DPF-Zertifizierung

TIA & TOMs

EU AI Act

CLOUD Act beachten

🏢 DSGVO-Einordnung pro Modell

🟢 Jetzt DSGVO-konform (IONOS, DE)

🟡 EU-fähig per Self-Hosting (Open-Weight)

🔴 Nicht DSGVO-konform (Closed)

1 Was der „KI-Index“ bedeutet

2 Quellen zum Nachschlagen

Artificial Analysis

LMArena

BenchLM

LLM-Stats

SWE-Bench

Hugging Face