Die Geschichte von Alibaba & Qwen
Vom E-Commerce-Riesen über DAMO und M6 bis Qwen 3.7 — wie Alibaba über Open Source zur KI-Weltspitze wurde.
Konfidenz-Kennzeichnung
- ✅ Faktum (belegt)
- 🟡 teilweise belegt
- 🔵 Interpretation
Kategorien
- Unternehmen
- Forschung
- Sicherheit
- Modell
- Produkt
- Kontroverse
Zeitleiste
Sechs Kapitel von iDST bis Qwen3.7-Max. Filtere nach Kategorie oder durchsuche alle Ereignisse — jeder Eintrag führt seine Quellen mit.
iDST, City Brain & DAMO
Vom E-Commerce-Riesen zu eigenen Forschungslaboren.
iDST — Alibabas erste Datenwissenschafts-Einheit
Unter COO Jeff Zhang entsteht das Institute of Data Science and Technologies (iDST), Alibabas erste zentrale Forschungseinheit für Empfehlungs- und Suchsysteme — der unscharfe Vorläufer der späteren DAMO Academy.
Hangzhou City BrainAlibaba Cloud ET
Auf der Yunqi (Cloud) Conference kündigt Alibaba mit der Stadt Hangzhou das „City Brain“ an: Es wertet Live-Verkehrsdaten aus und steuert Ampeln in Echtzeit. Laut Alibaba-eigener Auswertung stieg die Durchschnittsgeschwindigkeit in Pilotbezirken um 11–15 %.
Gründung der DAMO Academy
Jack Ma kündigt die DAMO Academy an, ausgestattet mit 100 Mrd. Yuan (~15 Mrd. USD) über drei Jahre und geplanten Laboren in China, den USA, Russland, Israel und Singapur — Alibabas bis dahin größte Forschungsinitiative, geleitet von CTO Jeff Zhang.
Erste Modelle & Regulierungs-Schock
M6, AliceMind, eigene Chips — und die Krise um Ant Group und Kartellrecht.
Hanguang 800 — eigener KI-Inferenz-ChipHanguang 800
Auf der Apsara Conference stellt Alibaba den Inferenz-Chip Hanguang 800 vor: im ResNet-50-Standardtest 78.563 Bilder/Sekunde — laut Alibaba rund 4× schneller als der damals zweitbeste KI-Inferenz-Chip. Gefertigt von der Halbleitertochter T-Head (Pingtouge).
PLUG — frühes chinesisches GroßsprachmodellPLUG
DAMO veröffentlicht PLUG (Pre-training for Language Understanding and Generation) mit über 27 Mrd. Parametern — eines der ersten großen chinesischen Sprachmodelle.
Der Schock, der alles veränderte — und Alibaba indirekt zur KI-Wende zwang.
Geplatzter Ant-Group-Börsengang
Chinas Behörden stoppen kurz vor dem Termin den ~37 Mrd. USD schweren Börsengang der Ant Group — den bis dahin größten IPO der Welt — nach einem kritischen Auftritt von Jack Ma. Der Beginn einer beispiellosen Regulierungskrise für Alibaba.
Kurz vor dem Termin stoppten Chinas Behörden den ~37 Mrd. USD schweren Ant-Group-Börsengang — den damals größten IPO der Welt — nach Jack Mas kritischem Auftritt vor dem Bund-Finanzgipfel. Es folgten eine Rekord-Kartellstrafe und Jack Mas Rückzug. Erst dieser Vertrauens- und Bewertungsverlust (rund 70 % bis 2022) erzwang die strategische Neuausrichtung auf Cloud und KI.
M6 — multimodales Mega-ModellM6
M6 erscheint als 10-Mrd.-Parameter-Produktivversion; Forschungsarbeiten skalieren das MoE-Design experimentell bis 10 Bio. Gesamtparameter (kein produktiver Release) — laut Alibaba-eigener Angabe mit nur 1 % der GPT-3-Energie (unabhängige Bestätigung steht aus).
Rekord-Kartellstrafe von 2,8 Mrd. USD
Die Kartellbehörde SAMR verhängt 18,2 Mrd. RMB (~2,8 Mrd. USD) gegen Alibaba wegen Marktmachtmissbrauchs — die höchste Kartellstrafe der chinesischen Geschichte. Jack Ma zieht sich weitgehend zurück; bis 2022 verliert Alibaba rund 70 % seines US-Börsenwerts.
AliceMind — Open-Source-NLP-FamilieAliceMind / StructBERT
DAMO öffnet die AliceMind-Familie (rund um StructBERT); sie führte sechs internationale NLP-Benchmarks an und gewann u. a. die VQA Challenge 2021 (79,78 %). AliceMind diente als Grundlage für die spätere Qwen-Reihe.
US-Chip-Exportkontrollen beginnen
Die USA beschränken den Export von KI-Spitzenchips (A100/H100) nach China — der Auftakt zu mehreren Verschärfungen (2023, 2024), die Alibabas Rechen-Nachschub dauerhaft prägen.
Restrukturierung & Tongyi Qianwen
Aufspaltung in sechs Einheiten und Alibabas ChatGPT-Moment.
Aufspaltung in sechs Geschäftseinheiten
Alibaba kündigt die größte Restrukturierung seiner Geschichte an: sechs eigenständige Einheiten (u. a. Cloud Intelligence), jede mit eigener IPO-Option — eine Antwort auf Regulierungsdruck und den Verlust von rund 70 % Börsenwert seit 2020.
Chinas prominenteste Antwort auf ChatGPT — 200.000+ Beta-Anfragen in zwei Wochen.
Tongyi Qianwen — Alibabas ChatGPT-MomentTongyi Qianwen
Alibaba Cloud stellt das Sprachmodell Tongyi Qianwen (通义千问, „Qwen“) vor — Chinas prominenteste Antwort auf ChatGPT. Bis Ende April beantragen über 200.000 Unternehmen Beta-Zugang; das Modell wird in DingTalk und Tmall Genie integriert.
Tongyi Qianwen (通义千问, „Qwen“) war Alibabas direkte Antwort auf ChatGPT, vorgestellt auf der Apsara Conference. Binnen zwei Wochen beantragten über 200.000 Unternehmen Beta-Zugang; das Modell wurde in DingTalk und Tmall Genie ausgerollt. CEO Daniel Zhang sprach von einem „Wasserscheiden-Moment“.
Im Kapitel weiterlesen →Tongyi Wanxiang — BildgeneratorTongyi Wanxiang
Auf der World AI Conference in Shanghai erscheint der Bildgenerator Tongyi Wanxiang (通义万相) — Alibabas Antwort auf Midjourney und DALL·E; später mehrfach erweitert (Wanx 2.1 führt 2025 die VBench-Videobewertung an).
Die strategische Wette: alles offen — und damit zum globalen Standard werden.
Qwen-7B — Open Source ab Tag einsQwen-7B
Alibaba gibt die erste Open-Source-Variante Qwen-7B unter Apache-2.0 frei (genaues Datum nicht offiziell kommuniziert) — der Auftakt einer konsequenten Open-Weight-Strategie, die zur wichtigsten strategischen Weichenstellung der gesamten Geschichte wird.
Anders als die meisten Konkurrenten gab Alibaba Qwen von Anfang an quelloffen frei — beginnend mit Qwen-7B unter Apache 2.0 im August 2023. Diese Open-Weight-Strategie wurde zur wichtigsten Weichenstellung: Sie machte Qwen zur Basis zehntausender Ableger und zum De-facto-Standard im offenen Ökosystem.
Im Kapitel weiterlesen →Aufbau der Qwen-Familie
Qwen 1.5 bis 2.5, die multimodale Linie und der Einstieg ins Reasoning.
Qwen 1.5Qwen 1.5
Die erste breite Qwen-Familie (0.5B–110B) erscheint — der Beginn einer hohen Release-Kadenz, die Qwen rasch im offenen Ökosystem verankert.
Qwen 2Qwen 2
Qwen 2 bringt einen Effizienzsprung mit dichten und MoE-Varianten und festigt Alibabas Position unter den führenden offenen Modellen.
Qwen 2.5 (+ Coder, Math, VL)Qwen 2.5
Auf der Apsara Conference erscheint Qwen 2.5: auf 18 Bio. Token trainiert, mit dichten Modellen (0.5B–72B) sowie Qwen2.5-Coder und -Math; Anfang 2025 folgt das multimodale Qwen2.5-VL.
Qwen-VL & Qwen2-VL — multimodale LinieQwen-VL
Parallel zur Sprachlinie baut Alibaba multimodale Modelle: Qwen-VL/Qwen-VL-Max (2023) werden zu Qwen2-VL mit dynamischer Auflösung weiterentwickelt; Qwen-Audio ergänzt das Portfolio.
QwQ-32B-Preview — Einstieg ins ReasoningQwQ-32B-Preview
Der experimentelle QwQ-32B-Preview (auf Qwen-2.5-Basis) erreicht laut internen Benchmarks DeepSeek-R1-Niveau in mehreren Disziplinen — bei nur 32 Mrd. statt 671 Mrd. Parametern.
Reasoning, Qwen 3 & DeepSeek-Schock
Qwen 2.5-Max, das 53-Mrd.-Programm und Qwen 3 mit Hybrid-Reasoning.
Qwen 2.5-Max — Antwort auf DeepSeek-V3Qwen 2.5-Max
Im DeepSeek-V3-Hype veröffentlicht Alibaba Qwen 2.5-Max und erklärt, es übertreffe DeepSeek-V3 in mehreren Benchmarks; die Hongkonger Aktie steigt daraufhin um 7 %.
380 Mrd. Yuan (53 Mrd. USD) für Cloud & KI
Alibaba kündigt das größte private Cloud-/KI-Infrastrukturprogramm Chinas an: mind. 380 Mrd. Yuan (~53 Mrd. USD) über drei Jahre — mehr als die gesamten Cloud-/KI-Ausgaben des vorigen Jahrzehnts. CEO Eddie Wu nennt AGI das Langfristziel.
QwQ-32B (final, Apache 2.0)QwQ-32B
Das finale QwQ-32B erscheint quelloffen unter Apache 2.0 und zeigt, dass starkes Reasoning auch mit deutlich kleineren Modellen möglich ist.
Jack Mas Rückkehr & 100-Mrd.-Rally
Jack Ma kehrt sichtbarer ins Tagesgeschäft zurück; getrieben von KI-Optimismus steigen Alibabas US-Listings seit Jahresbeginn um rund 60 % — ein Börsenwertplus von etwa 100 Mrd. USD.
Denken und schnelles Antworten in einem Modell — Reasoning wird zum Standard.
Qwen 3 — Hybrid-ReasoningQwen 3 (235B-A22B)
Die Qwen-3-Familie (8 Modelle: 2 MoE inkl. 235B-A22B + 6 dichte) führt nahtloses Umschalten zwischen „Denkmodus“ und schnellem Antwortmodus ein, trainiert auf 36 Bio. Token, 119 Sprachen — und läuft am Starttag nativ auf Huawei-Ascend-Chips.
Die Qwen-3-Familie (acht Modelle, darunter das MoE-Modell 235B-A22B) führte nahtloses Umschalten zwischen „Denkmodus“ und schnellem Antwortmodus ein — wo DeepSeek, OpenAI und Google getrennte Linien pflegten. Trainiert auf 36 Bio. Token und 119 Sprachen, lief Qwen 3 am Starttag nativ auf Huawei-Ascend-Chips.
Im Kapitel weiterlesen →US-Verbot der H20-Lieferungen
Mit dem „AI Diffusion“-Regelwerk verschärfen die USA die Kontrollen und stoppen faktisch die Lieferung von Nvidias China-Chip H20 — ein direkter Schlag gegen Alibabas Rechen-Nachschub (2025 waren ~39 Mrd. Yuan für KI-Chips budgetiert).
Qwen3-2507-RefreshesQwen3-2507
Mitte 2025 erscheinen aktualisierte Qwen3-Checkpoints („2507“) mit verbesserter Leistung und längerem Kontext — Teil der dichten Iterations-Kadenz.
Globale Open-Source-Dominanz
200.000+ Derivate, Qwen3-Max-Thinking und Qwen3.7-Max.
Über 200.000 Ableger — die meistgenutzte offene Modellfamilie der Welt.
Über 200.000 Qwen-Derivate, >1 Mrd. Downloads
Qwen wird zur weltweit meistgenutzten Open-Source-Modellfamilie: über 200.000 Derivate auf Hugging Face (mehr als Google und Meta zusammen), ~1 Mrd. Downloads. Industrie und Tech-Firmen weltweit bauen darauf auf.
Anfang 2026 wurde Qwen zur weltweit meistgenutzten offenen Modellfamilie: über 200.000 Derivate auf Hugging Face — mehr als Google und Meta zusammen — und rund 1 Milliarde Downloads. Von Automobil über Industrie bis zu Silicon-Valley-Firmen bauten Organisationen weltweit auf Qwen auf.
Im Kapitel weiterlesen →An der Weltspitze: vor Gemini 3 Pro und GPT-5.2 auf Humanity’s Last Exam.
Qwen3-Max-Thinking — Reasoning-FlaggschiffQwen3-Max-Thinking
Alibabas Billionen-Parameter-Reasoning-Modell mit autonomer Werkzeugnutzung (Suche, Code) erreicht laut VentureBeat-Auswertung auf Humanity’s Last Exam (mit Suche) 49,8 — vor Gemini 3 Pro und GPT-5.2-Thinking. Die Messung erfolgte teils durch Alibaba selbst.
Alibabas Billionen-Parameter-Reasoning-Modell nutzt während der Inferenz autonom Werkzeuge (Suche, Code, Speicher). Auf Humanity’s Last Exam (mit Suche) erreichte es laut VentureBeat-Auswertung 49,8 und lag damit vor Gemini 3 Pro (45,8) und GPT-5.2-Thinking (45,5) — wobei die Messung teils von Alibaba selbst stammt.
Im Kapitel weiterlesen →Qwen3.5-Omni — vollständig multimodalQwen3.5-Omni
Qwen3.5-Omni vereint Text, Bild, Audio und Video in einem 30B-MoE (Thinker-Talker-Architektur), mit Echtzeit-Sprachausgabe; Spracherkennung in 113 Sprachen, -ausgabe in 36, 256K Kontext.
Qwen3.7-Max — Agenten-FlaggschiffQwen3.7-Max
Auf dem Alibaba Cloud Summit erscheint Qwen3.7-Max als bislang fortschrittlichstes Agenten-/Reasoning-Modell: 1-Mio.-Token-Kontext, nativer Extended-Thinking-Modus, stark bei Coding und langen Mehrschritt-Aufgaben. Erstmals wieder closed-weight, nur über die DashScope-API.
Qwen3.7-PlusQwen3.7-Plus
Anfang Juni 2026 ergänzt Qwen3.7-Plus die Reihe; die Ankündigung trieb Alibabas Aktie um über 6 %. Ein „Qwen 4“ ist zu diesem Zeitpunkt nicht veröffentlicht.
Acht Teile mit Quellenkritik, Datierung und Einordnung — auf einer eigenen, ruhigen Leseseite.
