Die Geschichte von Mistral AI
Vom Pariser Drei-Gründer-Start-up über Mistral 7B und die ASML-Allianz bis Vibe — Europas sichtbarste Antwort auf die US- und China-Labore.
Konfidenz-Kennzeichnung
- ✅ Faktum (belegt)
- 🟡 teilweise belegt
- 🔵 Interpretation
Kategorien
- Unternehmen
- Forschung
- Sicherheit
- Modell
- Produkt
- Kontroverse
Zeitleiste
Vier Kapitel von der Gründung 2023 bis zum europäischen Full-Stack 2026. Filtere nach Kategorie oder durchsuche alle Ereignisse — jeder Eintrag führt seine Quellen mit.
Gründung & der offene Gegenangriff
Drei Ex-Meta/DeepMind-Gründer, Mistral 7B, Rekord-Seed und Mixtral 8x7B.
Gründung von Mistral AI in Paris
Drei Gründer starten Mistral: Arthur Mensch (CEO, ehem. DeepMind), Guillaume Lample (CSO) und Timothée Lacroix (CTO) — beide Co-Autoren von Metas LLaMA. Die Mischung aus europäischem Talent und kalifornischer Methodik erklärt den rasanten Start; offiziell als SAS eingetragen am 28. April 2023, frühere Vor-Gespräche reichen bis Februar/März 2023 zurück.
„Wir sind kein OpenAI“ — Open Source als DNA
Mistral positioniert sich von Beginn an als Open-Source-first: Europa brauche keinen geschlossenen Gegenpol zu OpenAI, sondern offene Modelle, die in jeder Cloud laufen. Diese Haltung unterscheidet Mistral von Aleph Alpha und allen französischen Vorgängern — und führt später zu Reibungen mit dem EU AI Act.
Rekord-Seed: 105 Mio. EUR im ersten Monat
Kurz nach der Gründung sammelt Mistral eine Seed-Runde über 105 Mio. EUR (≈ 113 Mio. USD) ein — eine der größten europäischen Seed-Runden ihrer Zeit, geführt von Lightspeed; Bewertung 240 Mio. EUR. Eine politische Ansage für den europäischen KI-Standort.
Der erste ernstzunehmende europäische Beitrag zur offenen LLM-Welt.
Mistral 7B — der europäische GegenangriffMistral 7B
Das erste Modell (7,3 Mrd. Parameter, Apache 2.0) schlägt Llama 2 13B in allen Benchmarks. Architektonisch neu: Grouped-Query Attention für schnellere Inferenz und Sliding Window Attention für langen Kontext. Veröffentlicht per Torrent plus Hugging Face — der erste ernstzunehmende europäische Beitrag zur offenen LLM-Landschaft.
Mistral 7B (27. September 2023) war der europäische Gegenangriff: 7,3 Mrd. Parameter unter Apache 2.0, die in allen Benchmarks Llama 2 13B schlugen. Architektonisch brachte es Grouped-Query Attention für schnellere Inferenz und Sliding Window Attention für effizienten langen Kontext. Die Veröffentlichung per Torrent-Link plus Hugging Face löste in der Open-Source-Community einen kleinen Erdrutsch aus — und etablierte Mistral binnen Wochen als ernstzunehmenden offenen Modellanbieter.
Im Kapitel weiterlesen →Mixtral 8x7B + Series A (385 Mio. EUR)Mixtral 8x7B
Mistrals erstes offenes Sparse-Mixture-of-Experts-Modell übertrifft Llama 2 70B bei deutlich schnellerer Inferenz — pro Token sind nur 2 von 8 Experten aktiv (Apache 2.0). Zeitgleich eine Series A über 385 Mio. EUR (≈ 415 Mio. USD) bei rund 2 Mrd. Bewertung — keine sieben Monate nach Gründung. Investoren u. a. a16z, General Catalyst, Lightspeed, Nvidia.
Microsoft, Multi-Cloud & die Modell-Offensive
Mistral Large, Le Chat, die Mixtral-/Codestral-/NeMo-Welle und die 6-Mrd.-Bewertung.
Europa bekommt einen Sitz am Tisch der Hyperscaler.
Microsoft-Partnerschaft — ein Sitz am Hyperscaler-Tisch
Microsoft kündigt eine mehrjährige Partnerschaft an: Mistral wird zum zweiten kommerziellen LLM-Anbieter auf Azure nach OpenAI. Die Investition von 15 Mio. EUR ist klein gegenüber dem OpenAI-Deal, aber symbolisch gewaltig — und ruft prompt EU- und UK-Wettbewerbsbehörden auf den Plan.
Am 26. Februar 2024 machte Microsoft Mistral zum zweiten kommerziellen LLM-Anbieter auf Azure — nach OpenAI. Die Investition von 15 Mio. EUR war im Vergleich zum 10-Mrd.-USD-OpenAI-Deal winzig, aber das Signal war gewaltig: Ein europäisches Modellhaus bekam einen Sitz am Tisch der Hyperscaler. EU-Kommission und die britische CMA prüften den Deal prompt, befanden ihn aber für wettbewerbsrechtlich unbedenklich — ein Vorgeschmack auf die kommenden Regulierungsdebatten.
Im Kapitel weiterlesen →Mistral Large — die geschlossene Antwort auf GPT-4Mistral Large
Parallel zur Microsoft-Ankündigung erscheint Mistral Large, das erste rein proprietäre Modell — Benchmarks platzieren es „auf Platz 2 hinter GPT-4“. Kein Open-Source-Release, sondern kommerzielle Lizenz über La Plateforme und Azure: die erste Abkehr von der reinen Open-First-Doktrin und Vorbote des hybriden Geschäftsmodells.
Le Chat — das europäische ChatGPT-Pendant
Le Chat startet als Beta: eine schnelle, multilinguale Chat-Alternative zu ChatGPT auf Mistral-Modellen. Später (November 2024) deutlich aufgewertet mit Web-Suche samt Quellen, Canvas, Bildgenerierung (Flux Pro), PDF-Analyse (Pixtral Large) und einer Agenten-Schicht.
Mixtral 8x22B — größtes offenes Modell seiner ZeitMixtral 8x22B
Ein SMoE mit 176 Mrd. Gesamt- / ~39 Mrd. aktiven Parametern, 64k Kontext, Apache 2.0 — damals das größte offene Modell weltweit (knapp hinter Grok-1). Es erreichte GPT-3.5-Niveau bei offener Lizenz, ein massiver Hebel für die Open-Source-Community.
Codestral — der Schritt in vertikale ModelleCodestral
Mistral betritt den Code-Modell-Markt: ein 22-Mrd.-Parameter-Modell, trainiert auf 80+ Programmiersprachen. Lizenz ist die nicht-kommerzielle MNPL — freier Einsatz für Hobby-Projekte, kommerzielle Nutzung an einen Vertrag gebunden. Ein weiterer Baustein der hybriden Strategie.
Series B: 600 Mio. EUR — Bewertung verdreifacht
Die Series B über 600 Mio. EUR (468 Mio. Eigen- + 132 Mio. Fremdkapital) bewertet Mistral mit 5,8 Mrd. EUR (≈ 6 Mrd. USD) — Verdreifachung seit Dezember 2023. Geführt von General Catalyst; neue strategische Investoren: Nvidia, Samsung, Cisco, IBM. Mensch betont Unabhängigkeit und Gründerkontrolle.
Mistral NeMo 12B — die NVIDIA-KooperationMistral NeMo 12B
Gemeinsam mit NVIDIA: ein 12-Mrd.-Parameter-Modell, trainiert auf DGX Cloud, mit dem Tekken-Tokenizer (≈ 30 % effizienter), 128k Kontext und starker Multilingualität (Apache 2.0). NVIDIA gewinnt einen prominenten europäischen Partner, Mistral Zugang zu Top-Hardware und Vertrieb.
Mistral Large 2 — Multi-Cloud-FlaggschiffMistral Large 2
123 Mrd. Parameter, 128k Kontext, deutlicher Sprung bei Code, Mathematik, Reasoning und Tool-Use; in ausgewählten Benchmarks auf Augenhöhe mit GPT-4o, Claude 3 Opus und Llama 3.1 405B. Verfügbar auf La Plateforme, Azure, AWS Bedrock und Google Vertex AI — Multi-Cloud von Anfang an.
Pixtral 12B — der Sprung in MultimodalitätPixtral 12B
Mistrals erstes multimodales Modell (Text + Bild): NeMo 12B plus ein neu trainierter 400-Mio.-Parameter-Vision-Encoder. Apache 2.0; variable Bildgrößen, mehrere Bilder, 128k Kontext.
Reasoning, die ASML-Wende & Souveränität
Magistral, Spezialmodelle, ASMLs Milliarden-Einstieg, Mistral Compute und Mistral 3.
Vertikales Portfolio: Saba, Medium 3 & DevstralSaba · Medium 3 · Devstral
Mistral baut spezialisierte Modelle aus: Codestral Mamba (Mamba-Architektur), Mistral Saba (Arabisch und südindische Sprachen), Mistral Medium 3 (frontier-class, multimodal, Enterprise/Coding) und Devstral (agentisches Software-Engineering, mit All Hands AI). Codestral wird mit 25.01/25.08 als Refresh-Linie fortgeführt.
Souveränität als Geschäftsmodell: SAP, Orange, Helsing
Mistral baut systematisch Partnerschaften in regulierten Sektoren auf: SAP (Business-AI für Europa), Orange (Telekom), Helsing (Verteidigungs-KI) sowie Industriepartner wie Ericsson und ESA. Mensch positioniert Mistral explizit als „Sovereign AI“-Anbieter gegen die „Generic AI“ der US-Hyperscaler.
Mistrals erster Schritt ins Reasoning — „from scratch“ mit reinem RL.
Magistral — Mistrals erstes Reasoning-ModellMagistral
Magistral erscheint in zwei Versionen: Magistral Small (24 Mrd., Apache 2.0, offen) und Magistral Medium (proprietär). Trainiert „from scratch mit reinem Reinforcement Learning“, ohne Reasoning-Trajektorien anderer Modelle — positioniert für regulierte Branchen mit nachvollziehbarer Argumentation. In externen Benchmarks lag es allerdings hinter Gemini 2.5 Pro und OpenAI o3.
Magistral (10. Juni 2025) war Mistrals erstes Reasoning-Modell, in zwei Versionen: Magistral Small (24 Mrd., Apache 2.0, offen) und das proprietäre Magistral Medium. Trainiert wurde es nach eigener Aussage „from scratch mit reinem Reinforcement Learning“, ohne Reasoning-Trajektorien anderer Modelle wie DeepSeek R1 — positioniert für regulierte Branchen, in denen nachvollziehbare Argumentation Compliance-Vorteile bringt. In externen Benchmarks lag Magistral allerdings hinter Gemini 2.5 Pro und OpenAI o3; Mistral räumte selbst ein, noch nicht an der Reasoning-Spitze zu sein.
Im Kapitel weiterlesen →Mistral Compute — die eigene europäische Cloud
Mit Mistral Compute startet (gemeinsam mit NVIDIA) eine eigene AI-Cloud — vom Bare-Metal-Cluster bis zu verwalteten Kubernetes-/Slurm-Angeboten. Reveal im Juni 2025, erste externe Kunden im März 2026; Zielgröße 200 MW souveräne Compute-Kapazität in der EU bis 2027. Eine explizite Ansage gegen Azure, AWS und Google Cloud.
Europas Chip-Riese verbündet sich mit Europas Modellhaus — 11,7 Mrd. EUR.
ASML steigt ein — die geostrategische Wende
Die Series C über 1,7 Mrd. EUR (≈ 2 Mrd. USD) wird vom niederländischen Lithographie-Riesen ASML angeführt, der allein 1,3 Mrd. EUR investiert und 11 % übernimmt. Post-Money-Bewertung 11,7 Mrd. EUR (≈ 13,8 Mrd. USD) — Mistral wird zum wertvollsten KI-Unternehmen Europas. Europas wichtigster Chipausrüster verbündet sich mit Europas sichtbarstem Modellhaus.
Die Series C (9. September 2025) über 1,7 Mrd. EUR wurde vom niederländischen Lithographie-Riesen ASML angeführt, der allein 1,3 Mrd. EUR investierte und 11 % übernahm. Die Post-Money-Bewertung von 11,7 Mrd. EUR machte Mistral zum wertvollsten KI-Unternehmen Europas. Geostrategisch ist der Deal mehr als Kapital: Europas wichtigster Halbleiterausrüster verbündet sich mit Europas sichtbarstem Modellhaus. Das stärkt das Souveränitätsnarrativ — ersetzt aber kurzfristig nicht die Abhängigkeit von NVIDIA-GPUs.
Eine komplette offene Modell-Range — Flaggschiff Large 3 als 675-Mrd.-MoE.
Mistral 3 — die dritte GenerationMistral 3 / Large 3
Eine komplette Modell-Range mit einheitlicher Architektur: Ministral 3B/8B/14B (dichte kleine Modelle), dazu das Flaggschiff Mistral Large 3 — ein Sparse-MoE mit 675 Mrd. Gesamt- / 41 Mrd. aktiven Parametern. Alle Modelle multimodal (256k Kontext), >40 Sprachen, durchgehend Apache 2.0, optimiert von Edge-Geräten bis Blackwell-Systemen.
Mistral 3 (2. Dezember 2025) war eine komplette Modell-Range mit einheitlicher Architektur: die dichten Ministral 3B/8B/14B und das Flaggschiff Mistral Large 3 — ein Sparse-MoE mit offiziell bestätigten 675 Mrd. Gesamt- und 41 Mrd. aktiven Parametern. Alle Modelle sind multimodal (Text + Bild), sprechen über 40 Sprachen und stehen durchgehend unter Apache 2.0, optimiert für Deployments von Edge-Geräten bis zu H100-/Blackwell-Systemen. Damit kehrte Mistral beim Flaggschiff demonstrativ zur offenen Lizenz zurück.
Im Kapitel weiterlesen →Forge, Vibe & der europäische Full-Stack
Eigene Cloud nahe Paris, Forge, Small 4, Voxtral, Medium 3.5 und Vibe.
Forge — die Enterprise-Plattform für eigene Modelle
Auf der NVIDIA GTC stellt Mistral Forge vor: eine Plattform, mit der Unternehmen eigene Frontier-Modelle auf proprietärem Wissen, internen Prozessen und Codebasen trainieren — statt nur Fine-Tuning oder RAG. Frühe Kunden: ASML, Ericsson, ESA, Reply sowie Singapurs DSO und HTX. Mistral wird damit zum Anbieter von Custom-Model-Infrastruktur.
Content-Levy-Vorstoß & EU AI Act
In einem FT-Gastbeitrag vom 19. März 2026 schlägt Arthur Mensch eine umsatzbezogene „Content Levy“ vor: 1,0–1,5 % des EU-Jahresumsatzes kommerzieller KI-Anbieter (auch ausländischer) sollen in einen zentralen europäischen Kulturfonds fließen — geschätzte Erlöse über 3,5 Mrd. USD für 2026; Stand Juni 2026 ist daraus keine EU-Gesetzgebung geworden. Kritiker sehen den Versuch, unlizenzierte Trainingspraxis nachträglich zu legitimieren; Befürworter eine faire, einheitliche Abgabe. Parallel stellt der EU AI Act GPAI-Anbieter vor Dokumentations- und (bei systemischem Risiko) Melde- und Bewertungspflichten.
830 Mio. USD für ein Rechenzentrum nahe Paris
Mistral nimmt eine 830-Mio.-USD-Schuldfinanzierung (sieben Banken, u. a. Bpifrance, BNP Paribas, Crédit Agricole CIB, HSBC) für sein erstes eigenes AI-Rechenzentrum in Bruyères-le-Châtel (Essonne) südlich von Paris auf, betrieben von Eclairion: 13.800 NVIDIA-GB300-GPUs, rund 44 MW, Betriebsstart bis Ende Juni 2026 — Teil des Ziels von 200 MW EU-Compute bis 2027.
Frühjahrs-Refresh: Small 4, Voxtral TTS & Medium 3.5Small 4 · Voxtral · Medium 3.5
Mistral schärft sein Portfolio nach: Mistral Small 4 (16. März) vereint Instruct-, Reasoning- und Coding-Fähigkeiten in einem multimodalen Modell mit 256k Kontext; Voxtral TTS (23. März) ist Mistrals erstes Text-to-Speech-Modell; Mistral Medium 3.5 (28. April) erscheint als offenes 128B-Modell unter modifizierter MIT-Lizenz.
Vom Chat zum Arbeits- und Code-Agenten — der europäische Full-Stack.
Vibe — vom Chat zum Arbeits- und Code-Agenten
Im Mai 2026 wird Le Chat zu Vibe umbenannt und erweitert: Work- und Code-Agenten, Remote-Coding-Sessions und eine VS-Code-Erweiterung, gestützt auf Mistral Medium 3.5. Zusammen mit Mistral Compute und Forge operationalisiert Vibe das Souveränitäts-Versprechen als europäischen Full-Stack — Infrastruktur, eigene Modelle und Agenten aus einer Hand.
Im Mai 2026 wurde Le Chat zu Vibe — und vom Chat-Client zum Arbeits- und Code-Agenten: Work- und Code-Agenten, Remote-Coding-Sessions und eine VS-Code-Erweiterung, gestützt auf Mistral Medium 3.5. Zusammen mit Mistral Compute (eigene Cloud) und Forge (kundenspezifische Modelle) operationalisiert Vibe das Souveränitäts-Versprechen als europäischen Full-Stack: Infrastruktur, eigene Modelle und Agenten aus einer Hand — der Gegenentwurf zu den US-Hyperscalern.
Im Kapitel weiterlesen →Mistral prüft eigene Chips — bleibt vorerst bei NVIDIA
Im CNBC-Interview erklärt Arthur Mensch, Mistral prüfe perspektivisch eigene Chips, um die Inferenzkosten zu senken — betont aber, man laufe „heute vollständig auf NVIDIA“ (inklusive der 13.800 GB300-GPUs im neuen Rechenzentrum) und teste „nur hier und da ein paar Dinge“. Ein konkretes Chip-Programm, Team oder Foundry-Partner wurde nicht genannt.
Zehn Teile mit Quellenkritik, Datierung und Einordnung — auf einer eigenen, ruhigen Leseseite.
