Die Geschichte von Moonshot AI & Kimi
Vom Tsinghua-Spin-off über Long Context und Kimi K2 bis zur 20-Mrd.-Bewertung — wie „Dark Side of the Moon“ zu Chinas akademischstem KI-Tiger wurde.
Konfidenz-Kennzeichnung
- ✅ Faktum (belegt)
- 🟡 teilweise belegt
- 🔵 Interpretation
Kategorien
- Unternehmen
- Forschung
- Sicherheit
- Modell
- Produkt
- Kontroverse
Zeitleiste
Vier Kapitel von der Gründung 2023 bis zum IPO-Vorlauf 2026. Filtere nach Kategorie oder durchsuche alle Ereignisse — jeder Eintrag führt seine Quellen mit.
Gründung & der Kimi-Start
Yang Zhilins akademisches Erbe, die Seed-Runde und Kimi Chat mit Long Context.
Gründung von Moonshot AI in Beijing
Der NLP-Forscher Yang Zhilin (Transformer-XL, XLNet) gründet Moonshot AI (北京月之暗面科技, „Dark Side of the Moon“) — Firmenregistereintrag am 17. April 2023. Mitgründer: Zhou Xinyu und Wu Yuxin; Zhang Yutao wird CTO. Yang gilt als der „akademischste“ Kopf unter Chinas KI-Gründern.
Seed-Finanzierung: ~2 Mrd. Yuan in sechs Monaten
Bis zur öffentlichen Vorstellung sammelt Moonshot rund 2 Mrd. Yuan (≈ 280 Mio. USD) ein — Investoren u. a. HongShan (vormals Sequoia China), Capital Today und Monolith Management. Bewertung der ersten Tranche: 300 Mio. USD.
Der Startschuss: 200.000 Zeichen Kontext — Long Context als kühnstes Differenzierungsmerkmal Chinas.
Kimi Chat — Start mit 200.000 Zeichen KontextKimi Chat
Auf einer Pressekonferenz in Beijing stellt Moonshot Kimi Chat (Kimi 智能助手) vor; die öffentliche Öffnung folgt am 16. November 2023. Das Modell verarbeitet 200.000 chinesische Zeichen Kontext — ein im chinesischen Markt auffälliger Long-Context-Anspruch, getragen von optimierter Aufmerksamkeit und eigener Serving-Infrastruktur.
Kimi Chat (Kimi 智能助手) wurde am 9. Oktober 2023 vorgestellt und am 16. November 2023 öffentlich geöffnet. Das Modell verarbeitete 200.000 chinesische Zeichen — im chinesischen Markt ein außergewöhnlicher Long-Context-Anspruch. Entscheidend war, dass der Vorsprung nicht nur ein Produkt-Feature war, sondern auf optimierter Aufmerksamkeit und einer eigens gebauten Serving-Infrastruktur beruhte. Die oft zitierten 36 Mio. monatlich aktiven Nutzer gehören übrigens erst zu Oktober 2024, nicht zum Start.
Im Kapitel weiterlesen →Yangs „Closed Source ist der einzige Weg zur Super-App“
In seinem ersten großen Pressegespräch argumentiert Yang Zhilin, nur geschlossene Modelle könnten das „Flywheel“ aus Nutzerdaten, Personalisierung und Produkt aufbauen, das eine Super-App brauche — eine bewusste Gegenposition zum Open-Source-Trend von Meta (LLaMA) und Alibaba (Qwen). Diese These revidiert Moonshot später (Teil VII).
Long-Context, Big Money & der Streit
Der 2-Millionen-Zeichen-Sprung, Mooncake, Alibaba/Tencent als Anker — und die Recurrent-Klage.
Series A: 200 Mio. USD — Alibaba & Ant steigen ein
Moonshot schließt eine Series A über 200 Mio. USD ab, geführt von Alibaba und Ant Group; Bewertung 1,5 Mrd. USD. Das Signal: Alibaba setzt Moonshot als strategisches Asset im chinesischen KI-Wettlauf.
Series B: 1 Mrd. USD — Chinas damals größte KI-Runde
Wenige Wochen später folgt die Series B über 1 Mrd. USD — die bis dahin größte KI-Finanzierung Chinas. Bewertung post-money 2,5 Mrd. USD; angeführt von Alibaba, mit Xiaohongshu, Meituan, HongShan und Monolith. Alibabas Mittel waren teils an Alibaba-Cloud-Nutzung gekoppelt („Cloud für Cash“).
Verzehnfachung in fünf Monaten — 2 Millionen Zeichen, weit vor dem Westen.
Der 2-Millionen-Zeichen-Sprung
Moonshot erweitert das Kimi-Kontextfenster auf 2 Millionen chinesische Zeichen — eine Verzehnfachung in fünf Monaten. Erstmals werden komplette Codebases, mehrstufige Agenten-Aufgaben und große Dokumenten-Analysen für chinesische Entwickler praktisch nutzbar, deutlich vor westlichen Konkurrenten.
Am 18. März 2024 verzehnfachte Moonshot das Kontextfenster auf 2 Millionen chinesische Zeichen — in nur fünf Monaten. Damit wurden Codebase-Analyse über komplette Repositories, mehrstufige Agenten-Aufgaben und große Dokumenten-Analysen erstmals praktisch nutzbar, deutlich vor westlichen Konkurrenten. Long Context wurde so zur Signatur von Kimi und zum roten Faden, der später in die agentische Ausrichtung mündete.
Vom Chatbot zum „AI-Arbeitsbereich“
Im Lauf des Jahres erhält Kimi Bild-Upload, Datei-Analyse (PDF, Excel, Word) und Web-Suche mit Quellenangabe; die UI wird zum Arbeitsbereich umgebaut — parallel zu Anthropics Artifacts und OpenAIs Canvas. Die Kommerzialisierung beginnt in der ersten Jahreshälfte.
Mooncake — die Serving-Infrastruktur hinter Long ContextMooncake
Das Kimi-Team veröffentlicht den technischen Bericht zu Mooncake, einer KVCache-zentrierten, disaggregierten LLM-Serving-Architektur: getrennte Prefill-/Decoding-Cluster, CPU/DRAM/SSD als KV-Cache-Pool. In Simulationen bis zu 525 % mehr Durchsatz, unter realer Kimi-Last 75 % mehr Requests — der Long-Context-Vorsprung war auch ein Infrastruktur-Vorsprung.
Series C: 300+ Mio. USD — Tencent kommt dazu
Eine Series C über 300+ Mio. USD bei 3,3 Mrd. USD Bewertung, geführt von Tencent und Bain Capital (mit IDG Capital). Moonshot wird damit zum vierten chinesischen KI-Unternehmen mit Geld von Alibaba und Tencent — nach Zhipu, Baichuan und MiniMax.
Die Recurrent-AI-Klage (HKIAC-Schiedsverfahren)
Fünf Investoren aus Yangs früherem Start-up Recurrent AI — darunter Meituan, HongShan und GSR Ventures — reichen beim Hong Kong International Arbitration Centre ein Schiedsverfahren gegen Yang Zhilin und Zhang Yutao ein: Der Moonshot-Spin-off sei ohne ordnungsgemäße Aktionärs-Zustimmung erfolgt. Moonshot kündigt rechtliche Verteidigung an; ein Ausgang ist bis Juni 2026 nicht öffentlich.
Reasoning & der Open-Source-Pivot
Kimi K1.5, die offene Forschungswelle und der Trillion-Parameter-Sprung mit Kimi K2.
Das erste chinesische Modell auf OpenAI-o1-Niveau im Reasoning.
Kimi K1.5 — der Reasoning-SchrittKimi K1.5
Moonshot veröffentlicht Kimi K1.5, das erste chinesische Modell, das OpenAI o1 formal in multimodalen Reasoning-Benchmarks erreicht. Der Long-CoT-Modus erzielt o1-Niveau in Mathematik, Code und multimodalem Reasoning; ein 128k-Fenster mit „Partial Rollout“ macht das RL-Training effizient. K1.5 erscheint zeitgleich mit DeepSeek R1 und markiert den chinesischen Reasoning-Durchbruch.
Kimi K1.5 (20. Januar 2025) war das erste chinesische Modell, das OpenAI o1 formal in multimodalen Reasoning-Benchmarks erreichte. Der Long-CoT-Modus erzielte o1-Niveau in Mathematik, Code und multimodalem Reasoning; ein 128k-Fenster mit „Partial Rollout“ machte das RL-Training effizient. K1.5 erschien praktisch zeitgleich mit DeepSeek R1 — beide unabhängig, mit ähnlichen RL-auf-Chain-of-Thought-Methoden, und beide bewiesen, dass chinesische Modelle Frontier-Reasoning beherrschen.
Im Kapitel weiterlesen →Die offene Forschungswelle vor K2Kimi-VL / Kimi-Dev
Vor K2 öffnet Moonshot eine Reihe spezialisierter Systeme: Kimi-VL (Vision-Language-MoE), Kimina-Prover (formales Beweisen in Lean 4), Kimi-Audio und Kimi-Dev-72B (Coding). Der Open-Source-Pivot beginnt also nicht erst mit K2, sondern wird im Frühjahr 2025 vorbereitet.
Die Kehrtwende: vom „Closed Source“ zum offenen Trillion-Parameter-Modell.
Kimi K2 — der Open-Weight-Pivot (1 Bio. Parameter)Kimi K2
Kimi K2 erscheint als Sparse-MoE mit 1 Bio. Gesamt- / 32 Mrd. aktiven Parametern (384 Experten, 8 pro Token aktiv), trainiert auf 15,5 Bio. Tokens mit dem neuen MuonClip-Optimierer. Open weights unter Modified MIT, 128k Kontext, auf agentische Aufgaben spezialisiert (bis zu 17 Tools pro Workflow). Damit vollzieht Yang die Kehrtwende weg vom „Closed Source“.
Mit Kimi K2 (11. Juli 2025) vollzog Moonshot die strategische Kehrtwende: vom „Closed Source ist der einzige Weg zur Super-App“ hin zu offenen Gewichten. K2 ist ein Sparse-MoE mit 1 Bio. Gesamt- / 32 Mrd. aktiven Parametern, trainiert auf 15,5 Bio. Tokens mit dem neuen MuonClip-Optimierer, veröffentlicht unter Modified MIT. Treiber waren DeepSeek R1, das das „Closed Source“-Argument entwertete, und die großen Open-Source-Communities von Qwen und Llama. K2 war weniger ein reines Reasoning- als ein Agentic-/Coding-Modell.
Im Kapitel weiterlesen →Kimi K2 Thinking — offenes Reasoning mit Tool-UseKimi K2 Thinking
Eine offene Reasoning-Variante von K2 (1T/32B, 256k Kontext) mit „interleaved thinking“ für agentische Werkzeugnutzung — auffällig ist die Fähigkeit, sehr lange Ketten von Tool-Aufrufen konsistent zu halten. Externe Stimmen loben die Benchmarks, viele Zahlen bleiben aber zunächst Moonshot-/GitHub-intern.
Moonshot unter den „AI Six Tigers“ (六小虎)
Die chinesische Berichterstattung zählt Moonshot zu den „sechs kleinen Tigern“ — neben Zhipu/Z.ai, MiniMax, Baichuan, StepFun und 01.AI. Während Zhipu und MiniMax ihre Hong-Kong-IPOs vorantreiben, bleibt Moonshot zunächst privat.
Späte Finanzierung: 500 Mio. USD bei 4,3 Mrd. Bewertung
Berichte über eine neue 500-Mio.-USD-Runde bewerten Moonshot mit rund 4,3 Mrd. USD. Yang schreibt laut SCMP intern, man sei kurzfristig nicht in IPO-Eile — eine Haltung, die sich Anfang 2026 rasch ändern sollte.
Agentic-AI & der Weg zum IPO
K2.5/K2.6 mit Agent Swarm, die 20-Mrd.-Bewertung und der HK-IPO-Vorlauf.
Agent Swarm — bis zu 100 Klon-Agenten parallel, 1.500 koordinierte Schritte.
Kimi K2.5 — Visual Agentic & „Agent Swarm“Kimi K2.5
K2.5 ist die erste vollständig multimodale K-Variante (Text, Bild, Video; 1T/32B-MoE, 256k Kontext, ~15 Bio. Visual-/Text-Tokens). Schlüsselinnovation „Agent Swarm“: bis zu 100 parallele Klon-Agenten mit bis zu 1.500 koordinierten Schritten — Recherche-Aufgaben um Faktor 3–4,5 beschleunigt. Integrierte Office-Skills (Word, Excel, PPT, PDF) greifen Microsoft 365 Copilot direkt an.
Kimi K2.5 (27. Januar 2026) war die erste vollständig multimodale Variante (Text, Bild, Video). Die Schlüsselinnovation „Agent Swarm“ orchestriert bis zu 100 parallele Klon-Agenten mit bis zu 1.500 koordinierten Schritten und beschleunigt große Recherche-Aufgaben um Faktor 3–4,5. Mit integrierten Office-Skills (Word, Excel, PPT, PDF) zielte K2.5 direkt auf Microsoft 365 Copilot. Eine unabhängige Safety-Evaluation lobte die Fähigkeiten, mahnte aber fehlende öffentliche Safety-Tests an.
Im Kapitel weiterlesen →Unabhängige Safety-Evaluation von K2.5
Eine externe Sicherheitsanalyse bestätigt zwar starke Coding-, multimodale und agentische Fähigkeiten, kritisiert aber, dass K2.5 ohne systematische öffentliche Safety-Evaluation erschien und bei CBRNE-/Missbrauchsanfragen seltener verweigert als vergleichbare geschlossene Frontier-Modelle — ein Governance-Punkt für offene Frontier-Modelle.
Kimi K2.6 — Long-Horizon Coding & größere SwarmsKimi K2.6
K2.6 fokussiert auf langlaufende Engineering-Aufgaben, Kimi Code und Full-Stack-Generierung; die Agent-Swarm-Grenze steigt von 100 Sub-Agenten/1.500 Schritten auf bis zu 300 Sub-Agenten/4.000 koordinierte Schritte. TechCrunch berichtet Anfang Mai, K2.6 sei das zweitmeistgenutzte Modell auf OpenRouter.
20 Mrd. USD Bewertung — eines der wertvollsten privaten KI-Modellhäuser der Welt.
2 Mrd. USD bei 20 Mrd. USD Bewertung
TechCrunch berichtet, Moonshot habe rund 2 Mrd. USD bei 20 Mrd. USD Bewertung aufgenommen (geführt von Meituans Long-Z, mit Tsinghua Capital, China Mobile, CPE Yuanfeng); in sechs Monaten insgesamt 3,9 Mrd. USD, ARR im April über 200 Mio. USD. Das setzt Moonshot über Mistral und macht es zu einem der wertvollsten privaten KI-Modellhäuser — hinter OpenAI, xAI und Anthropic.
Im Mai 2026 nahm Moonshot laut TechCrunch rund 2 Mrd. USD bei 20 Mrd. USD Bewertung auf — geführt von Meituans Long-Z, mit Tsinghua Capital, China Mobile und CPE Yuanfeng. In sechs Monaten flossen demnach insgesamt 3,9 Mrd. USD; der ARR lag im April über 200 Mio. USD. Damit liegt Moonshot über Mistral und zählt zu den wertvollsten privaten KI-Modellhäusern weltweit — hinter OpenAI, xAI und Anthropic, womöglich hinter DeepSeek.
Im Kapitel weiterlesen →VIE-Strukturabbau für den Hong-Kong-IPO
Berichten zufolge baut Moonshot seine Offshore-/VIE-Struktur um, um den Weg für einen Hong-Kong-IPO zu ebnen — Hintergrund sind strengere chinesische und Hongkonger Anforderungen an Offshore-Listings. Zu lesen als berichtete IPO-Vorbereitung, nicht als vollzogener Börsengang.
Zehn Teile mit Quellenkritik, Datierung und Einordnung — auf einer eigenen, ruhigen Leseseite.
