KI-Modelle 2026 — Übersicht

Stand Juni 2026

Die wichtigsten KI-Modelle 2026 — im Überblick

Eine umfassende, verständliche Übersicht der relevantesten Sprach-/Code-Modelle und Videomodelle: was sie können, was sie kosten, wie sie abschneiden — und welche generell DSGVO-konform nutzbar sind. Oben links zwischen Einfach und Technisch umschaltbar.

Kurzfassung: Beim Preis-Leistungs-Verhältnis führen 2026 die offenen China-Modelle (DeepSeek, GLM, Qwen, Kimi). Die US-Modelle (Claude, GPT, Gemini, Grok) sind an der Spitze und sehr zuverlässig, aber Closed, teurer und nicht selbst hostbar. Für Datenhoheit zählen die in DE gehosteten IONOS-Modelle und — als Ziel — offene Modelle im EU-Self-Hosting.

Modell-Landkarte

Alle aktuellen Modelle auf einen Blick — Leistung gegen Preis, Farbe nach Herkunft, Ring nach DSGVO-Status. Beschriftet sind die Stärksten und die besten Preis-Leistungs-Modelle; für alle anderen über den Punkt fahren.

Modell-Landkarte lädt …

i So liest du die Karten

✅ Gut für / ⛔ Weniger geeignet

Stärken und ehrliche Grenzen jedes Modells in einfacher Sprache.

📊 KI-Index

Farbiger Balken = grobe Leistung (Artificial-Analysis-Index, 0–65). Details im Bereich „Benchmarks & Quellen“.

🟢🟡🔴 Kosten-Ampel

grün = günstig, gelb = mittel, rot = teuer. Genaue Preise im Technik-Modus.

🇪🇺 DSGVO-Status

Grün = jetzt EU-konform (IONOS), Gelb = per EU-Hosting machbar, Rot = nicht konform (Closed).

Sprach- & Code-Modelle

Alle LLMs

Die wichtigsten Sprach- und Code-Modelle 2026. Filtere nach Herkunft oder Anwendung; schalte auf Technisch für Kontext, Lizenz und genaue Preise.

Farben des KI-Index: ■ Spitze · ■ sehr stark · ■ stark · ■ solide · ■ älter. Werte teils gerundet/geschätzt — Methodik & Quellen im eigenen Bereich.
Datenhoheit

DSGVO-konform — welche Modelle, wenn man welche will?

DSGVO-Konformität hängt weniger vom Modell ab als davon, wo es läuft und unter welchem Vertrag. Fast jedes Modell lässt sich konform nutzen — über den richtigen Weg. Hier die drei Wege plus die nötigen Bausteine.

Kein Rechtsrat: technische Orientierung, keine Rechtsberatung. Die konkrete Konformität (AVV, Datenkategorien, Transfer-Folgenabschätzung) bitte mit Datenschutzbeauftragten/Rechtsabteilung klären.

🟢 Weg 1: EU-Anbieter — Daten bleiben in der EU

am einfachsten

Anbieter, die unter EU-Recht firmieren und in der EU verarbeiten — außerhalb der Reichweite des US CLOUD Act, direkt konform nutzbar (mit AVV). Das ist der sauberste Weg.

IONOS AI Model Hub DE
gpt-oss, Qwen3-Coder, Mistral Small, Llama, FLUX, OCR · ISO 27001, BSI C5, Gaia-X
Mistral AI FR
Eigene API + „Le Chat“ Enterprise, EU-Datenresidenz; offene Apache-2.0-Modelle
Aleph Alpha DE
Souveräne Enterprise-KI, On-Prem/EU — für regulierte Branchen & Behörden
openhippo.ai DE
Hosting offener Modelle in Deutschland (Cloud oder On-Prem)
Souveräne Clouds EU
OVHcloud (FR), Scaleway (FR), STACKIT / T-Systems (DE) — EU-Rechenzentren für KI

🟢 Weg 2: Open-Weight selbst in der EU hosten

volle Kontrolle

Offene Modelle auf eigener Hardware oder in einer EU-Cloud (EU-Anbieter) betreiben — die Daten verlassen die EU nie und liegen außerhalb des US CLOUD Act. Volle Kontrolle.

DeepSeek · GLM · Qwen · Kimi China, open
Open-Weight (MIT/Apache/Mod-MIT) → in der EU hostbar, dann DSGVO-konform
Mistral · Llama · gpt-oss EU/US, open
Offen → EU-Self-Hosting ohne Datenabfluss
DeepSeek-TNG R1T2 Chimera DE, open
Deutsches Open-Weight-Modell, ideal fürs EU-Hosting

🟡 Weg 3: US-Frontier über EU-Region + Vertrag (bedingt)

mit Auflagen

Die stärksten Closed-Modelle lassen sich in einer EU-Region mit Auftragsverarbeitungsvertrag und Zero-Retention betreiben. Aber: EU-Datenresidenz senkt das Risiko — sie beseitigt es nicht (siehe Kasten unten).

⚠ Der Haken: US CLOUD Act. US-Anbieter können — auch über ihre EU-Regionen und eigenen „Sovereign Clouds“ — per CLOUD Act (2018) und FISA 702 von US-Behörden gezwungen werden, Daten herauszugeben, selbst wenn diese in der EU liegen. Das ist der Kern von Schrems II: Verträge (SCCs/DPF) und EU-Residenz reduzieren den Zugriff, heben ihn rechtlich aber nicht auf. EU-Kommission, EDSA und das EU-Cloud-Sovereignty-Framework (Okt. 2025) behandeln US-kontrollierte Anbieter deshalb als Rest-Transferrisiko, das Vertragsklauseln allein nicht ausräumen.
⚠ Wichtige Warnung — häufiger Irrtum: Genau dieser Punkt wird in der Praxis regelmäßig missverstanden und falsch gehandhabt. Der verbreitetste Fehler: „EU-Region = DSGVO-sicher“ — und damit gilt die Prüfung als erledigt. Das ist falsch. Die EU-Region bestimmt nur den Speicherort, nicht den rechtlichen Zugriff. Ebenso wird oft angenommen, die „Sovereign Cloud“ eines US-Anbieters sei automatisch CLOUD-Act-immun — auch das trifft nicht zu, solange ein US-Mutterkonzern dahintersteht. Konsequenz: EU-Datenresidenz ohne AVV, ohne eigene Schlüssel (BYOK/HYOK) und ohne dokumentierte Risikobewertung ist keine belastbare DSGVO-Konformität für personenbezogene Daten — auch wenn sie häufig genau so verkauft und eingesetzt wird.
Azure OpenAI „Data Zone (EUR)“ GPT-5.5
GPT in der EU (EU Data Boundary), Zero-Retention möglich · US-Konzern → CLOUD-Act-Restrisiko
Amazon Bedrock EU Claude
Claude mit EU-Datenresidenz (Frankfurt), kein Routing zu Anthropic-US · US-Konzern → CLOUD-Act-Restrisiko
Google Vertex AI (Europe-West) Gemini & Claude
Gemini & Claude in EU-Region, Zero Data Retention · US-Konzern → CLOUD-Act-Restrisiko
„Sovereign Clouds“ (US-betrieben) umstritten
AWS European Sovereign Cloud (DE, seit 01/2026), MS Delos/Bleu — EU-Betrieb, aber US-Mutterkonzern → CLOUD-Act-Immunität rechtlich umstritten
OpenAI / Anthropic direkt Hinweis
OpenAI: EU-Datenresidenz verfügbar. Anthropic direkt nur US/global → EU über Bedrock/Vertex
Voraussetzungen & Risikominderung: EU-Region gepinnt · AVV/DPA + SCCs · Zero-Retention / kein Training · DPF-Zertifizierung · Transfer-Folgenabschätzung (TIA). CLOUD-Act-Risiko technisch mindern: Verschlüsselung mit eigenen, in der EU gehaltenen Schlüsseln (BYOK/HYOK) — kann der Anbieter die Schlüssel nicht einsehen, kann er auch keine lesbaren Daten herausgeben („technische Unmöglichkeit“). Für streng vertrauliche oder personenbezogene Daten gilt trotzdem: echte Souveränität nur über Weg 1 (EU-Anbieter) oder Weg 2 (Self-Hosting).

Sovereignty Washing — die häufigen Irreführungen

„Sovereignty Washing“ bezeichnet, wenn ein Dienst europäische Souveränität vortäuscht, obwohl versteckte US-Abhängigkeiten bleiben — meist, indem Datenresidenz (wo Daten liegen) als Datensouveränität (wer rechtlich Kontrolle/Zugriff hat) verkauft wird. Der EU-Cloud-Verband CISPE warnt, dass dies sogar in EU-Regularien einzusickern droht.

Residenz ≠ Souveränität Muster
„Data residency“ (Speicherort EU) wird als „data sovereignty“ (rechtliche Kontrolle) vermarktet — zwei verschiedene Dinge.
US-eigene „Sovereign Cloud“ Muster
Separate EU-Einheit, EU-Personal, eigenes Billing — aber US-Mutterkonzern → CLOUD Act greift weiter (AWS ESC, MS Sovereign Cloud).
„Trusted“ / JV-Clouds Muster
EU-Marke auf US-Technik: S3NS (Thales + Google), Bleu (Orange/Capgemini + Microsoft), Delos (SAP + Microsoft). CISPE nennt die S3NS-Anerkennung „institutionalisiertes Sovereignty Washing“.
EU-Label, US-Backend Muster
Europäisch gebrandete SaaS-Tools, die im Hintergrund auf US-kontrollierten Diensten speichern.
Belege aus der Praxis: Microsoft konnte vor dem französischen Senat (2025) nicht garantieren, dass Daten französischer Bürger ohne Zustimmung französischer Behörden nicht an US-Stellen gehen. Nextcloud-Gründer Frank Karlitschek nennt Microsofts jüngste „Souveränitäts“-Offensive offen „Sovereignty Washing“. CISPEs Faustregel: Souveränität bemisst sich an Kontrolle — nicht an bloßer EU-Präsenz. (US-Hyperscaler halten ~70 % des EU-Cloud-Markts, EU-Anbieter nur ~15 %.)
Woran man echte Souveränität erkennt: Anbieter, der unter EU-Recht firmiert und nicht von einem US-Konzern kontrolliert wird · keine US-Mutter- oder JV-Konstruktion · EU-Gerichtsbarkeit · idealerweise eigene bzw. kundengehaltene Schlüssel. „EU-Region“, „EU-Personal“ oder „separate Einheit“ allein genügen nicht.

🔴 Eher kritisch — ohne Zusatzmaßnahmen meiden

China-Direkt-APIs Risiko
MiniMax, ERNIE, Qwen-Max, DeepSeek über China-API — Daten in China, kein DPF
Consumer-Apps ohne Vertrag Risiko
ChatGPT/Gemini Free/Plus ohne Enterprise-AVV — mögliche Trainingsnutzung

Bausteine der Konformität

EU-Datenresidenz

Verarbeitung in einer EU-Region; Daten verlassen die EU nicht.

AVV / DPA + SCCs

Auftragsverarbeitungsvertrag, bei US-Bezug zusätzlich Standardvertragsklauseln.

Zero-Retention / kein Training

Eingaben werden nicht gespeichert und nicht zum Training genutzt.

DPF-Zertifizierung

EU-US Data Privacy Framework als Grundlage für US-Transfers (aktiv, gerichtlich bestätigt 2025).

TIA & TOMs

Transfer-Folgenabschätzung plus technisch-organisatorische Maßnahmen.

EU AI Act

Wesentliche Pflichten gelten ab 2. August 2026 — zusätzlich zur DSGVO beachten.

CLOUD Act beachten

US-Anbieter sind trotz EU-Region nicht CLOUD-Act-immun. Echte Immunität nur bei EU-Anbietern, Self-Hosting oder eigenen Schlüsseln (BYOK/HYOK).

🏢 DSGVO-Einordnung pro Modell

Die Modelle dieser Übersicht nach DSGVO-Status — was per EU-Hosting (z. B. IONOS) schon heute konform läuft, was per Self-Hosting machbar ist und was Closed bleibt:

Jetzt nutzbar: über das IONOS AI Model Hub (DE) gehostet — sofort DSGVO-konform.

🟢 Jetzt DSGVO-konform (IONOS, DE)

Ziel: die offenen Top-Modelle (v. a. China) per EU-Self-Hosting (IONOS/openhippo) anbieten — dann ebenfalls konform.

🟡 EU-fähig per Self-Hosting (Open-Weight)

Nur zum Evaluieren: Closed-Modelle (US/China) — nicht für Kundendaten.

🔴 Nicht DSGVO-konform (Closed)

Kurz: Für echte Datensouveränität führen Weg 1 (EU-Anbieter) und Weg 2 (Self-Hosting) — beide liegen außerhalb des US CLOUD Act. Weg 3 (US-Frontier in EU-Region) ist praktikabel und mit AVV/DPF zulässig, trägt aber ein CLOUD-Act-Restrisiko. Faustregel: je sensibler bzw. personenbezogener die Daten, desto eher Weg 1 oder 2 — oder zumindest eigene Schlüssel (BYOK/HYOK).
Text-zu-Video

Videomodelle

Videomodelle sind eine eigene Modellklasse (Diffusion/DiT) — kein Sprach-LLM erzeugt Video. Der Markt ist 2026 „multipolar“: je nach Budget, Qualität, Ton, Lizenz und Self-Hosting-Wunsch gibt es andere Sieger.

Wichtig: OpenAI Sora 2 ist eingestellt (Web/App seit 26.04.2026, API-Ende 24.09.2026) — nicht mehr einplanen. Für DSGVO/EU eignen sich die offenen Modelle (LTX, Wan, HunyuanVideo), da selbst in der EU hostbar.
Arena-Elo stammt aus der Artificial Analysis Video Arena (Blindvergleiche, höher = besser). Modelle ohne Elo sind anders positioniert (z. B. kreative Kontrolle).
Methodik

Benchmarks & Quellen

Womit die Leistungswerte belegt sind und wie der KI-Index zu lesen ist — damit die Vergleiche nachvollziehbar bleiben.

1 Was der „KI-Index“ bedeutet

Der KI-Index-Balken orientiert sich am Artificial Analysis Intelligence Index v4.0 — einem zusammengesetzten Wert aus zehn Tests: GDPval-AA, τ²-Bench Telecom, Terminal-Bench Hard, SciCode, AA-LCR, AA-Omniscience, IFBench, Humanity’s Last Exam, GPQA Diamond und CritPt. Ein einzelner Wert pro Modell macht sehr unterschiedliche Modelle grob vergleichbar. Skala hier ~0–70 (aktuelle Spitze: Claude Fable 5 mit 65). Quelle direkt: artificialanalysis.ai/models ↗ (abgerufen 10.06.2026, Index-Stand 07.06.2026).

Verifiziert vs. geschätzt: Direkt aus der Quelle stammen u. a. Claude Fable 5 (65), Claude Opus 4.8 (61), GPT-5.5 (60), Gemini 3.1 Pro (57), Qwen3.7 Max (57), Gemini 3.5 Flash (55), MiniMax M3 (55), MiMo-V2.5-Pro (54), Kimi K2.6 (54), Grok 4.3 (53), Claude Sonnet 4.6 (52), DeepSeek V4-Pro (52), GLM-5.1 (51), DeepSeek V4-Flash (47), Qwen3.6-27B (46), Mistral Medium 3.5 (39), Nemotron 3 Super (36), gpt-oss-120b (33), Mistral Large 3 (23), Llama 3.3 70B (14) — Stand AA-Index v4.0, 07.06.2026. Übrige Werte sind gerundete Schätzungen zur groben Einordnung und im Technik-Modus als „ca.“ erkennbar.

Warum schneidet Mistral Large 3 mit 23 so niedrig ab? Large 3 ist ein Non-Reasoning-Modell — es antwortet direkt, ohne ausgedehntes Mitdenken. Der v4-Index besteht aber überwiegend aus Reasoning- und Agentik-Tests (Terminal-Bench, GDPval, GPQA, Humanity’s Last Exam …), bei denen Denkmodelle systematisch vorne liegen. Artificial Analysis führt Large 3 zudem auch innerhalb der offenen Non-Reasoning-Klasse unterdurchschnittlich. Zur Einordnung: Schreibqualität, EU-Datenhoheit und die freie Apache-Lizenz misst der Index nicht — und fürs Schlussfolgern ist bei Mistral derzeit Medium 3.5 (Index 39) die stärkere Wahl. Beleg: artificialanalysis.ai/models/mistral-large-3 ↗

2 Quellen zum Nachschlagen

Artificial Analysis

Intelligence Index (LLMs) + Video Arena (Elo). Hauptquelle dieser Übersicht.

artificialanalysis.ai ↗

LMArena

Blind-Vergleiche durch Nutzer (Elo) für Chat, Coding, Vision, Search.

lmarena.ai ↗

BenchLM

Aggregierte Leaderboards inkl. China-Modelle und Provisional-Rankings.

benchlm.ai ↗

LLM-Stats

Vergleich von 300+ Modellen nach Intelligenz, Tempo, Preis.

llm-stats.com ↗

SWE-Bench

Coding-Benchmark: Anteil real gelöster Software-Aufgaben.

swebench.com ↗

Hugging Face

Offizielle Model Cards (Lizenz, Größe, Benchmarks) der Anbieter.

huggingface.co ↗
Hinweis: Benchmarks sind Momentaufnahmen und je nach Testaufbau unterschiedlich. Diese Übersicht dient der groben Orientierung, nicht als exakte Rangliste. Für Entscheidungen die verlinkten Originalquellen prüfen.
Glossar

Begriffe erklärt

Die wichtigsten Wörter aus den Karten — je in einem Satz.

KI-Index
Grober Gesamt-Leistungswert (Artificial Analysis Intelligence Index), der viele Tests zu einer Zahl bündelt. Höher = fähiger.
Arena-Elo
Bewertung aus Blindvergleichen: Nutzer wählen zwischen zwei Ergebnissen, ohne das Modell zu kennen. Höhere Elo = häufiger bevorzugt.
Kontextlänge
Wie viel Text das Modell auf einmal „im Kopf“ behält. 1 Mio. Tokens ≈ ganze Bücher oder Code-Projekte.
Token
Wortbaustein, in dem Länge und Preis gerechnet werden — grob 1.000 Tokens ≈ 750 Wörter.
Multimodal
Das Modell versteht nicht nur Text, sondern auch Bilder (manche auch Audio/Video).
Open-Weight
Die Modellgewichte sind frei verfügbar — selbst hostbar, auch in der EU. Closed = nur über die fremde API nutzbar.
DSGVO-konform
Verarbeitung datenschutzkonform in der EU. Erreichbar über EU-Hosting (z. B. IONOS) oder eigenes EU-Self-Hosting offener Modelle.
Self-Hosting
Modell auf eigenen/gemieteten Servern betreiben — volle Datenkontrolle, braucht passende Hardware (GPU).
Lizenz
Nutzungsbedingungen. Apache 2.0 / MIT = sehr frei, kommerziell ok. „Nicht-kommerziell“ = im Geschäft nur mit Genehmigung.
MoE (Mixture of Experts)
Großes Modell, das pro Anfrage nur einen Teil seiner „Experten“ aktiviert — viel Wissen bei moderater Rechenlast.
Datenresidenz vs. Datensouveränität
Residenz = wo Daten liegen (z. B. EU-Region). Souveränität = wer rechtlich Kontrolle/Zugriff hat. US-Residenz ≠ Souveränität, solange US-Recht (CLOUD Act) greift.
Sovereignty Washing
Marketing, das EU-Souveränität vortäuscht (z. B. „Data residency“ als „Souveränität“), obwohl US-Kontrolle bzw. CLOUD-Act-Zugriff bestehen bleiben.
CLOUD Act
US-Gesetz (2018): verpflichtet US-kontrollierte Anbieter, Daten an US-Behörden herauszugeben — auch wenn sie in der EU liegen.
BYOK / HYOK
Eigene Verschlüsselungs-Schlüssel (in der EU gehalten). Kann der Anbieter sie nicht einsehen, kann er keine lesbaren Daten herausgeben.
Stand: Juni 2026. Modell-, Lizenz-, Preis- und Benchmark-Angaben per Websuche geprüft; Benchmark-Werte teils gerundet/geschätzt (siehe „Benchmarks & Quellen“). Orientierungshilfe, keine verbindliche Zusage. Überblick von Aux Valley. Mehr: KI-Landschaft — die großen KI-Player.