Die Geschichte von DeepSeek

DeepSeek · Quellenbelegte Chronik

Die Geschichte von DeepSeek

Vom Quant-Fonds High-Flyer über den „R1-Schock“ bis DeepSeek-V4 — Modelle, Effizienz und Kontroversen.

Position · Juni 2026Frontier-Herausforderernah dran, fordert die Führer heraus
Stand: 4. Juni 2026
0Ereignisse
2016–26zehn Jahre
0Modelle
0Quellen-Belege

Konfidenz-Kennzeichnung

  • Faktum (belegt)
  • 🟡 teilweise belegt
  • 🔵 Interpretation

Kategorien

  • Unternehmen
  • Forschung
  • Sicherheit
  • Modell
  • Produkt
  • Kontroverse
Interaktiv · in Kapiteln

Zeitleiste

Fünf Kapitel von High-Flyer bis DeepSeek-V4. Filtere nach Kategorie oder durchsuche alle Ereignisse — jeder Eintrag führt seine Quellen mit.

Ära 01 · 2016–2022

Die Vorgeschichte: High-Flyer

Vom KI-Quant-Fonds High-Flyer zu eigenen GPU-Clustern.

Unternehmenbelegt

Gründung des Quant-Fonds High-Flyer

Liang Wenfeng gründet mit Kommilitonen den KI-getriebenen Hedgefonds High-Flyer (幻方) in Hangzhou. Bis 2021 läuft der Handel vollständig über KI-Strategien; der Fonds verwaltet zeitweise rund 10 Mrd. USD.

Unternehmenbelegt

Fire-Flyer: eigene GPU-Supercomputer

High-Flyer baut eigene KI-Cluster auf: Fire-Flyer I (2020, 1.100 GPUs) und Fire-Flyer II (2021) mit rund 10.000 Nvidia-A100-GPUs — laut Liang allesamt erworben, bevor die USA Chip-Exportkontrollen verhängten. Diese Rechenbasis ermöglicht später alle DeepSeek-Trainingsläufe.

Ära 02 · 2023

Gründung & erste Modelle

DeepSeek wird eigenständig — Coder und die ersten Sprachmodelle.

Modellbelegt

DeepSeek Coder (erstes Open-Source-Modell)DeepSeek Coder

DeepSeeks erstes Modell erscheint quelloffen auf GitHub und richtet sich speziell an Code-Aufgaben — in mehreren Größen und unter freier Lizenz.

Ära 03 · 2024

Architektur-Durchbrüche & V3

MLA, der Preiskrieg und das effiziente Flaggschiff V3.

Modellbelegt

DeepSeek-V2 löst Chinas Preiskrieg ausDeepSeek-V2

DeepSeek-V2 (236B gesamt, 21B aktiv) führt Multi-head Latent Attention (MLA) und DeepSeekMoE ein und senkt Kosten drastisch. Der API-Preis liegt 90–95 % unter der Konkurrenz; Alibaba, Baidu und ByteDance senken daraufhin ihre Preise um bis zu 97 % — ein Preiskrieg in Chinas KI-Branche.

Modellbelegt

DeepSeek-V2.5DeepSeek-V2.5

V2.5 vereint Chat- und Coder-V2-Fähigkeiten in einem Modell, mit besserer Konversation und Code-Verarbeitung und stärkerer Ausrichtung an menschlichen Präferenzen.

Schlüsselmoment
Modellbelegt

Der stille Auslöser: Frontier-Leistung zu einem Bruchteil der üblichen Kosten.

DeepSeek-V3 — Frontier-Leistung zum Bruchteil der KostenDeepSeek-V3

Das 671B-MoE-Modell (37B aktiv, 14,8 Bio. Tokens) erreicht GPT-4o-/Claude-3.5-Niveau. Der Bericht weist nur ~5,576 Mio. USD reine GPU-Trainingskosten aus (Kritiker: Gesamtkosten viel höher). Die Effizienz wird zum Weckruf für die Branche.

Hintergrund

DeepSeek-V3 (671B MoE, 37B aktiv) erreichte das Niveau von GPT-4o und Claude 3.5 Sonnet, kostete laut Bericht aber nur ~5,576 Mio. USD reine GPU-Trainingszeit (2,79 Mio. H800-Stunden). Kritiker betonen, dass Gesamtkosten inklusive Forschung und Infrastruktur weit höher liegen. Dennoch verschob V3 die Wahrnehmung, was Spitzen-KI kosten muss.

Im Kapitel weiterlesen →
Ära 04 · 2025

Der R1-Schock & die Folgen

R1, das Börsenbeben, Verbote — und die Reife der Modellreihe.

Schlüsselmoment
Modellbelegt

Offen, günstig, auf o1-Niveau — das Modell, das den Westen aufschrecken ließ.

DeepSeek-R1 — offenes Reasoning-Modell (MIT)DeepSeek-R1

R1 erreicht laut DeepSeek das Niveau von OpenAI o1 bei Mathematik, Code und Logik — und wird mitsamt Gewichten unter MIT-Lizenz freigegeben. Die Variante R1-Zero zeigt erstmals großskaliges Reasoning aus reinem Reinforcement Learning (GRPO), dazu destillierte Modelle von 1,5B bis 70B.

Hintergrund

R1 erreichte bei Mathematik, Code und Logik OpenAI-o1-Niveau — und wurde mitsamt Gewichten unter MIT-Lizenz freigegeben. Die Variante R1-Zero zeigte, dass starkes Reasoning auch aus reinem Reinforcement Learning ohne Supervised Fine-Tuning entstehen kann. Innerhalb von Tagen stürmte die App weltweit an die Spitze der App-Stores.

Im Kapitel weiterlesen →
Modellbelegt

Janus-Pro — multimodale offene ModelleJanus-Pro

Zum Mondneujahr veröffentlicht DeepSeek die multimodalen Modelle Janus-Pro (1B/7B) und JanusFlow unter MIT-Lizenz; sie übertreffen auf Bild-Benchmarks DALL·E 3 und Stable Diffusion 3 Medium.

Produktbelegt

DeepSeek-App überholt ChatGPT (Platz 1)DeepSeek-R1

Die DeepSeek-App wird zur meistgeladenen Gratis-App im US-App-Store und verdrängt ChatGPT — in 52 Ländern auf Platz 1, ~16 Mio. Downloads in 18 Tagen.

Schlüsselmoment
Unternehmenbelegt

Ein Tag, an dem rund 589 Milliarden Dollar verdampften.

Nvidia verliert ~589 Mrd. USD an einem Tag

DeepSeeks Effizienz löst einen globalen Tech-Ausverkauf aus: Nvidia bricht ~17 % ein und verliert rund 589 Mrd. USD Marktwert — der größte Einzeltagesverlust der US-Börsengeschichte. Marc Andreessen nennt R1 „AIs Sputnik-Moment“.

Hintergrund

Am 27. Januar 2025 brach Nvidia um rund 17 % ein und verlor etwa 589 Mrd. USD Marktwert — der größte Einzeltagesverlust der US-Börsengeschichte. Anleger fragten, ob teure KI-Chips im bisherigen Umfang noch nötig seien. Marc Andreessen prägte den Vergleich vom „Sputnik-Moment“ der KI.

Im Kapitel weiterlesen →
Kontroversebelegt

Distillations-Vorwurf von OpenAI/MicrosoftDeepSeek-R1

Microsoft und OpenAI untersuchen, ob mit DeepSeek verbundene Akteure per „Distillation“ in großem Umfang OpenAI-API-Ausgaben abgegriffen haben, um eigene Modelle zu trainieren.

Sicherheitbelegt

Offene Datenbank: Chatverläufe & Schlüssel exponiert

Wiz Research entdeckt eine öffentlich erreichbare DeepSeek-Datenbank ohne Authentifizierung mit über 1 Mio. Log-Einträgen — inklusive Klartext-Chats und API-Schlüsseln. DeepSeek sichert sie nach der Meldung.

Sicherheitbelegt

Italien sperrt DeepSeek (erstes Land)

Die Datenschutzbehörde Garante ordnet die sofortige Sperrung an, nachdem DeepSeek auf Fragen zu Datenpraktiken und Speicherung in China „unzureichend“ antwortete — das erste Notfall-DSGVO-Verbot gegen einen KI-Chatbot.

Schlüsselmoment
Kontroversebelegt

Brillante Technik trifft auf die roten Linien der chinesischen Politik.

Zensur politisch sensibler ThemenDeepSeek-R1

Recherchen zeigen: Die DeepSeek-App verweigert rund 85 % der Fragen zu sensiblen Themen (Tiananmen, Taiwan, Xi, Uiguren) oder löscht begonnene Antworten in Echtzeit — entlang chinesischer Vorgaben.

Hintergrund

Untersuchungen zeigten, dass die DeepSeek-App rund 85 % der Fragen zu sensiblen Themen wie dem Tiananmen-Massaker, Taiwan oder Xi Jinping verweigerte — teils, indem sie begonnene Antworten in Echtzeit wieder löschte. Taiwan wurde als „unveräußerlicher Teil Chinas“ dargestellt. Die Filter folgen chinesischen Vorgaben und gelten vielen als Preis der staatlichen Einbettung.

Im Kapitel weiterlesen →
Sicherheitbelegt

Taiwan, Australien & Südkorea verbieten DeepSeek

Taiwan untersagt den Behördeneinsatz (31.1.), Australien verbietet die App auf Regierungsgeräten (4.2.), Südkorea entfernt sie aus den App-Stores (15.2.) — wegen Datenschutz- und Sicherheitsbedenken.

Unternehmenbelegt

Liang Wenfeng beim Xi-Symposium

Liang nimmt an Xi Jinpings Symposium mit Privatunternehmern teil — neben Jack Ma und Ren Zhengfei. Die Einladung gilt als implizite staatliche Anerkennung DeepSeeks.

Modellbelegt

DeepSeek-R1-0528 (Reasoning-Update)DeepSeek-R1-0528

Das R1-Update verdoppelt die Denk-Tiefe (mehr Reasoning-Tokens), hebt AIME-2025 von 70 % auf 87,5 % und senkt Halluzinationen deutlich; neu sind JSON-Output und Function Calling.

Modellbelegt

DeepSeek-V3.1 (hybrides Reasoning)DeepSeek-V3.1

V3.1 (671B, 128K Kontext) lässt sich per Vorlage zwischen Thinking-Modus (Chain-of-Thought wie R1) und Non-Thinking-Modus (direkt wie V3) umschalten; Gewichte unter MIT.

Schlüsselmoment
Forschungbelegt

Erstmals besteht ein großes offenes Modell ein wissenschaftliches Peer-Review.

DeepSeek-R1 auf dem Nature-CoverDeepSeek-R1

R1 wird in Nature publiziert — das erste große Open-Weight-Modell, das ein Peer-Review durchläuft. Offengelegt: die reinen R1-Reasoning-Trainingskosten von 294.000 USD (512 H800, ~80 Std.) auf Basis des ~6-Mio.-USD-V3.

Hintergrund

Im September 2025 erschien R1 in Nature — das erste große Open-Weight-Modell, das ein unabhängiges Peer-Review durchlief (acht Gutachter, 64 Seiten). Offengelegt wurden u. a. die reinen Reasoning-Trainingskosten von 294.000 USD (512 H800-GPUs, ~80 Stunden), aufbauend auf dem rund 6 Mio. USD teuren Basismodell V3.

Im Kapitel weiterlesen →
Modellbelegt

DeepSeek-V3.1-TerminusDeepSeek-V3.1-Terminus

Eine produktionsreife Endstufe der V3.1-Reihe: behebt Sprachmisch-Fehler, verbessert mehrsprachige Konsistenz sowie Code- und Such-Agenten.

Modellbelegt

DeepSeek-V3.2-Exp halbiert die API-PreiseDeepSeek-V3.2-Exp

Mit „DeepSeek Sparse Attention“ (Lightning Indexer + feinkörnige Token-Auswahl) sinken die API-Preise um ~50 % (unter 3 Cent je Mio. Input-Token), bei vergleichbarer Benchmark-Leistung; Gewichte unter MIT.

Ära 05 · 2026

V4 & Etablierung

Offenes V4 mit 1-Mio.-Kontext und die erste große Finanzierungsrunde.

Schlüsselmoment
Modellbelegt

Das offene Flaggschiff von 2026 — 1-Mio.-Kontext, zum Spottpreis.

DeepSeek-V4-Preview (1-Mio.-Kontext, Open Source)DeepSeek-V4

V4 erscheint in zwei offenen Varianten: V4-Pro (1,6 Bio. Parameter, 49B aktiv) und V4-Flash (284B, 13B aktiv), beide mit 1-Mio.-Token-Kontext und MIT-Lizenz; Sparse Attention senkt den Inferenzaufwand weiter. MIT Tech Review wertet es als Erfolg auch für Chinas Chip-Industrie.

Hintergrund

DeepSeek-V4 erschien als offene Preview in zwei Varianten — V4-Pro (1,6 Bio. Parameter, 49B aktiv) und V4-Flash (284B, 13B aktiv) — beide mit 1-Mio.-Token-Kontext unter MIT-Lizenz. Verbesserte Sparse Attention senkte den Inferenzaufwand weiter. MIT Technology Review wertete den Schritt auch als Erfolg für Chinas heimische Chip-Industrie.

Im Kapitel weiterlesen →
Unternehmenbelegt

Erste Finanzierungsrunde: ~45 Mrd. USD Bewertung

DeepSeek sucht erstmals externes Kapital bei einer Bewertung von rund 45 Mrd. USD; Chinas staatlicher „Big Fund“ soll die Runde anführen, Tencent und Alibaba sind in Gesprächen. Liang Wenfeng hält bislang knapp 90 %.

Keine Ereignisse für diese Auswahl.
Ausführliche Chronik
Tiefer einsteigen

Sieben Teile mit Quellenkritik, Datierung und Einordnung — auf einer eigenen, ruhigen Leseseite.

Zur ausführlichen Chronik →
Die Geschichte von DeepSeek — quellenbelegte Chronik, Stand 4. Juni 2026.
Inhaltlicher Anspruch: Fakten werden belegt, Unsicherheit benannt, Faktum von Deutung getrennt.