Die Geschichte von NVIDIA — Volltext

Vorbemerkung (Methodik)

Diese Chronik folgt dem gleichen Anspruch wie die übrigen Geschichten dieses Projekts: Fakten werden belegt, Unsicherheit wird benannt, und Tatsachen werden von Deutung getrennt. Quellenpriorität: Primärquellen (NVIDIA Newsroom, Investor Relations, SEC-Filings, technische NVIDIA-Blogs) > seriöse Presse/Agenturen (Reuters, AP, CNBC, TechCrunch) > Fachmedien (Tom’s Hardware, Data Center Dynamics, The Verge, Ars Technica) > Sekundärquellen.

Legende: ✅ belegt · 🟡 teilweise belegt / vorsichtig zu lesen · 🔵 Interpretation

Der rote Faden: NVIDIA ist kein klassisches Frontier-Modell-Labor wie OpenAI, Google DeepMind oder Anthropic. NVIDIA ist die Infrastruktur-Macht hinter dem KI-Zeitalter: Hardware, Netzwerk, Software, Inferenz-Frameworks, Modellfamilien, Robotik-Tooling und zunehmend komplette „AI Factories“. Der eigentliche Burggraben ist nicht nur der Chip, sondern die Kombination aus CUDA, Tensor Cores, NVLink/InfiniBand/Spectrum-X, DGX, NIM, Dynamo und Entwicklerökosystem.

Teil I – Von Grafikchips zu programmierbarem Compute (1993-2011)

✅ NVIDIA wurde am 5. April 1993 von Jensen Huang, Chris Malachowsky und Curtis Priem gegründet. Die bekannte Denny’s-Geschichte ist Teil der Unternehmenslegende; der belegte Kern ist die Gründung 1993 und die frühe Fokussierung auf Grafikchips.

✅ Mit der GeForce 256 (1999) prägte NVIDIA den Begriff GPU (Graphics Processing Unit). Das war zunächst eine Grafikgeschichte: 3D-Spiele, Transform & Lighting, PC-Gaming und Workstations. Für die spätere KI-Ära war aber entscheidend, dass Grafikberechnung massiv parallel ist.

✅ CUDA wurde 2006 eingeführt und machte NVIDIA-GPUs für allgemeine parallele Berechnungen programmierbar. Damit wurden GPUs von reinen Grafikchips zu universellen Beschleunigern. CUDA war über Jahre teuer und strategisch riskant, weil der KI-Markt noch nicht existierte.

🔵 Rückblickend war CUDA die wichtigste Entscheidung in NVIDIAs Geschichte. Die Hardware konnte nachgebaut oder eingeholt werden; das Ökosystem aus CUDA, Libraries, Entwicklerwissen und Framework-Integration wurde deutlich schwerer zu kopieren.

Quellen: NVIDIA – Corporate Timeline · NVIDIA – Mellanox/Company Boilerplate · NVIDIA Developer – CUDA

Teil II – Der Deep-Learning-Funke (2012-2019)

✅ AlexNet gewann 2012 den ImageNet-Wettbewerb mit großem Vorsprung und wurde auf zwei NVIDIA GTX 580 trainiert. NVIDIA hatte Deep Learning nicht erfunden, aber die eigene GPU-Hardware machte den Sprung praktisch möglich.

✅ 2014/2015 wurden Bibliotheken wie cuDNN für Deep Learning zentral. Zusammen mit CUDA sorgten sie dafür, dass Frameworks wie TensorFlow, PyTorch und später JAX auf NVIDIA-Stacks optimiert wurden.

✅ Am 6. April 2016 stellte NVIDIA den DGX-1 vor. Symbolisch wichtig: Die frühe DGX-Partnerschaft mit OpenAI wurde später von OpenAI und NVIDIA selbst als Startpunkt ihrer Compute-Zusammenarbeit beschrieben.

✅ Volta/V100 (2017) brachte Tensor Cores, spezialisierte Recheneinheiten für Matrixoperationen neuronaler Netze. Ab hier baute NVIDIA KI nicht mehr nur auf „allgemeine Parallelität“, sondern auf dedizierte KI-Mathematik.

🔵 2012-2019 war die Phase, in der NVIDIA vom „Gaming/Workstation-Chip-Anbieter“ zum unverzichtbaren Deep-Learning-Lieferanten wurde. Die Öffentlichkeit sah noch Spiele-GPUs; die Forschung sah bereits Trainingsinfrastruktur.

Quellen: AlexNet Paper · NVIDIA – cuDNN · OpenAI/NVIDIA Partnership · NVIDIA – Hopper Architecture In-Depth

Teil III – Datacenter-Stack: Mellanox, A100, H100, H200 und Blackwell (2020-2024)

✅ Mellanox wurde am 27. April 2020 für rund 7 Mrd. USD übernommen. Diese Übernahme wird in der KI-Geschichte oft unterschätzt: Für LLMs zählt nicht nur GPU-Leistung, sondern das Verbinden tausender GPUs. Mellanox brachte InfiniBand, Hochleistungsnetzwerke und das Fundament für NVIDIAs spätere Rack-Scale-Systeme.

✅ A100 (Ampere, 2020) wurde das erste große Datacenter-Flaggschiff der modernen KI-Ära. NVIDIA nennt 54 Mrd. Transistoren und Tensor Cores der dritten Generation. A100 dominierte Trainingscluster in der frühen LLM-Phase.

✅ H100 (Hopper, 2022) wurde nach ChatGPT zur begehrtesten Ressource der Branche. Hopper brachte unter anderem FP8-Unterstützung und deutlich höhere Transformer-Leistung. H200 (November 2023) erweiterte Hopper mit HBM3e-Speicher; NVIDIA nennt 141 GB HBM3e und 4,8 TB/s Bandbreite.

✅ Blackwell wurde im März 2024 vorgestellt. B200/GB200 und das GB200 NVL72 verschoben NVIDIA von Einzel-GPUs zu flüssigkeitsgekühlten Rack-Scale-„AI Supercomputern“. NVIDIA nennt für Blackwell 208 Mrd. Transistoren und für GB200 NVL72 72 GPUs in einem System.

🟡 Blackwell hatte 2024 Berichte über Design-/Ramp-Probleme und Rack-/Thermal-Themen. Jensen Huang bestätigte später, dass ein Blackwell-Designfehler behoben wurde. Bis 2025 meldete NVIDIA Blackwell NVL72 in voller Produktion. Deshalb ist die richtige Einordnung: Blackwell war kein problemloser Start, aber der Produktionshochlauf gelang.

Quellen: NVIDIA – Mellanox Acquisition · NVIDIA – A100 Tensor Core GPU · NVIDIA – Hopper Architecture · NVIDIA – H200 · NVIDIA – Blackwell · NVIDIA – GB200 NVL72 · Reuters/Investing – Blackwell-Designfehler · NVIDIA Q1 FY2026

Teil IV – Vom Chip zum vollständigen KI-Stack (2024-2026)

✅ NVIDIA verkauft längst nicht mehr nur GPUs. Der Stack umfasst CUDA, cuDNN, NCCL, TensorRT, Triton Inference Server, NeMo, NIM Microservices, DGX Cloud, Spectrum-X, NVLink, BlueField und Dynamo.

✅ Run:ai wurde Ende 2024 übernommen. Strategisch ergänzt die GPU-Orchestrierung den Stack: Wenn GPUs knapp und teuer sind, wird Auslastung selbst zum Produkt. NVIDIA kündigte an, Run:ai-Software breiter bzw. offener verfügbar zu machen.

✅ Dynamo wurde auf der GTC 2025 als Open-Source-Inference-Framework für Reasoning- und Agentenmodelle vorgestellt. In Q1 FY2027 meldete NVIDIA Dynamo 1.0 in Produktion und nannte bis zu 7x bessere generative/agentische Inferenz auf Blackwell-GPUs als Eigenangabe.

✅ NVLink Fusion (2025) öffnet NVIDIAs Scale-up-Verbindungslogik für semi-custom AI Infrastructure. Das ist strategisch wichtig, weil NVIDIA damit nicht nur eigene GPUs koppelt, sondern Partner-CPUs, Custom-ASICs und beschleunigte Systeme in das eigene Netzwerk-/Software-Ökosystem hineinzieht.

✅ DGX Spark und DGX Station bringen Grace-Blackwell-Systeme auf den Schreibtisch bzw. in kleinere Entwicklerumgebungen. Die frühere „Project DIGITS“-Idee wurde damit zu einer Produktlinie für lokale Modellprototypen, Agenten und Robotics-Workloads.

🔵 NVIDIA reagiert damit auf eine reale Gefahr: Hyperscaler bauen eigene Chips. Statt nur dagegen anzutreten, versucht NVIDIA, deren Sonderchips über NVLink Fusion, Spectrum-X, BlueField, NIM und Dynamo in NVIDIAs Infrastruktur-Logik einzubetten.

Quellen: NVIDIA – Run:ai Blog · European Commission – Run:ai Approval · NVIDIA – Dynamo · NVIDIA Developer – Dynamo · NVIDIA – NVLink Fusion · NVIDIA – Project DIGITS/DGX Spark · NVIDIA Q1 FY2027

Teil V – Eigene Modelle, Physical AI und Robotik

✅ NVIDIA ist weiterhin primär Infrastrukturunternehmen, aber nicht mehr modellfrei. Die wichtigsten Modell- und Softwarelinien sind:

Nemotron für offene Reasoning-/Agentenmodelle und Enterprise-Agenten.
Cosmos als World-Foundation-Model-Plattform für Physical AI, Robotik und autonome Fahrzeuge.
Isaac GR00T als offene Foundation-Model-Linie für humanoide Roboter.
BioNeMo und weitere wissenschaftliche Modellfamilien für Life Sciences.

✅ Cosmos wurde auf der CES 2025 als Plattform für generative World Foundation Models vorgestellt. GR00T N1 folgte auf der GTC 2025 als offenes, anpassbares Foundation Model für humanoide Robotik. 2026 erweiterte NVIDIA die offenen Modellfamilien um GR00T N1.7, Alpamayo 1.5, Cosmos 3 und weitere Modelle.

🔵 Dieser Schritt verändert die Einordnung: NVIDIA ist kein OpenAI-Konkurrent im Sinne eines dominanten Consumer-Chatbots, aber NVIDIA baut Modellfamilien, die den eigenen Hardware-/Software-Stack demonstrieren, standardisieren und Kunden binden.

Quellen: NVIDIA – Cosmos · NVIDIA – Cosmos Major Release · NVIDIA – Isaac GR00T N1 · NVIDIA – Open Model Families 2026 · arXiv – GR00T N1

Teil VI – Finanzielle Explosion und neue Berichtslogik

✅ NVIDIA schloss FY2026 (Geschäftsjahr bis Januar 2026) mit 215,9 Mrd. USD Umsatz ab, davon 193,7 Mrd. USD Datacenter-Umsatz. Das war ein massiver Sprung gegenüber FY2025.

✅ In Q1 FY2027 (gemeldet am 20. Mai 2026) erzielte NVIDIA 81,6 Mrd. USD Quartalsumsatz (+85 % gegenüber Vorjahr) und 75,2 Mrd. USD Datacenter-Umsatz (+92 % gegenüber Vorjahr). Die frühere Timeline hatte an dieser Stelle fälschlich die 39,1 Mrd. USD Datacenter-Umsatz aus Q1 FY2026 mit Q1 FY2027 vermischt; das wurde korrigiert.

✅ Ebenfalls im Mai 2026 erhöhte NVIDIA die Quartalsdividende von 0,01 USD auf 0,25 USD je Aktie und genehmigte zusätzlich 80 Mrd. USD Aktienrückkäufe. Gleichzeitig stellte NVIDIA die Berichterstattung auf zwei Plattformen um: Data Center und Edge Computing; innerhalb Data Center werden Hyperscale und ACIE (AI Clouds, Industrial, Enterprise) unterschieden.

🟡 NVIDIAs Börsenwert bewegte sich 2026 je nach Tag und Quelle um bzw. über 5 Billionen USD. Deshalb wird die alte Formulierung „wertvollstes Unternehmen der Welt“ als Momentaufnahme formuliert, nicht als dauerhaft stabile Tatsache.

🔵 Die Finanzzahlen zeigen die tektonische Verschiebung: Gaming ist wichtig, aber die Firma wird heute im Kern über AI Factories, Datacenter-Compute, Netzwerke, Inferenz und Cloud-Partnerschaften bewertet.

Quellen: NVIDIA FY2026 Results · NVIDIA Q1 FY2027 · CompaniesMarketCap – NVIDIA

Teil VII – Mega-Deals, Partner und „AI Factories“

✅ Am 22. September 2025 kündigten OpenAI und NVIDIA eine strategische Partnerschaft an: mindestens 10 Gigawatt NVIDIA-Systeme für OpenAIs nächste KI-Infrastruktur, verbunden mit NVIDIAs Absicht, bis zu 100 Mrd. USD progressiv in OpenAI zu investieren, sobald Gigawatt-Phasen ausgerollt werden. Wichtig: OpenAI formulierte dies als letter of intent; die Details sollten später finalisiert werden.

✅ Am 18. September 2025 kündigten NVIDIA und Intel eine Partnerschaft über mehrere Generationen von Datacenter- und PC-Produkten an. NVIDIA sollte 5 Mrd. USD in Intel-Aktien investieren; Intel soll x86-CPUs bzw. x86-RTX-SoCs mit NVIDIA-Technologien verbinden. Das ist bemerkenswert, weil NVIDIA damit parallel Arm-, x86- und eigene Grace/Vera-Strategien verfolgt.

✅ NVIDIA treibt außerdem Sovereign AI und nationale AI-Factory-Projekte: Saudi-Arabien/HUMAIN, Stargate UAE, Japan, Großbritannien und weitere Infrastrukturprogramme tauchen in NVIDIAs FY2026/FY2027-Kommunikation auf.

🟡 Berichte über xAI/Colossus, Groq-Lizenzen, Marvell-Partnerschaften und weitere Investments zeigen, wie eng Kapital, GPU-Supply und Kundendeals im KI-Infrastrukturboom verflochten sind. Solche Deals sollten aber jeweils als berichtet bzw. als NVIDIA-Eigenangaben gelesen werden, nicht automatisch als vollständig abgeschlossene Umsätze.

🔵 Der neue NVIDIA-Moat ist daher ein Dreieck: Chip + Netzwerk + Kapital-/Partnerökosystem. Wer die größten Modelle bauen will, braucht nicht nur GPUs, sondern Lieferpriorität, Rack-Designs, Netzwerk, Strom, Software und operative Erfahrung.

Quellen: OpenAI/NVIDIA Partnership · NVIDIA/Intel Partnership · NVIDIA Q1 FY2026 Highlights · Reuters/MarketScreener – xAI/NVIDIA berichtet

Teil VIII – Geopolitik, Exportkontrollen und Wettbewerb

✅ Die USA beschränkten seit 2022/2023 die Ausfuhr fortgeschrittener KI-Chips nach China. NVIDIA reagierte mit China-spezifischen Varianten wie H800 und H20. Am 9. April 2025 wurde auch H20 lizenzpflichtig. NVIDIA verbuchte in Q1 FY2026 eine 4,5-Mrd.-USD-Belastung für H20-Bestände und Kaufverpflichtungen und konnte zusätzlich 2,5 Mrd. USD H20-Umsatz nicht ausliefern.

✅ Im Q1-FY2027-Ausblick nahm NVIDIA ausdrücklich keinen Data-Center-Compute-Umsatz aus China an. Das ist wichtig: China bleibt ein großer potenzieller Markt, aber geopolitisch nicht planbar.

✅ Frankreichs Wettbewerbshüter und später auch China/SAMR nahmen NVIDIAs Marktmacht in den Blick. China erklärte im September 2025 auf Basis einer vorläufigen Untersuchung, NVIDIA habe Bedingungen der Mellanox-Freigabe verletzt; NVIDIA erklärte, gesetzeskonform zu handeln.

🟡 Wettbewerbsdruck kommt nicht nur von AMD oder Intel. Die stärkste strukturelle Gegenkraft sind Hyperscaler-eigene Chips: Google TPU, Amazon Trainium, Microsoft Maia, Meta MTIA und verschiedene ASIC-Partner. Gleichzeitig zeigen NVIDIAs eigene SEC-Angaben hohe Kundenkonzentration: In FY2026 standen zwei direkte Kunden für 22 % bzw. 14 % des Umsatzes.

🟡 Weitere Risiken: Abhängigkeit von TSMC und fortgeschrittenem Packaging, HBM-/Speicherknappheit, Strom- und Kühlungsbedarf, potenzielle KI-Investitionsblase, Exportkontrollen, Kartellverfahren und der Versuch großer Kunden, den CUDA-Burggraben zu umgehen.

Quellen: NVIDIA Q1 FY2026 – H20 · NVIDIA Q1 FY2027 – China Outlook · AP/PBS – China Antitrust · Reuters/Investing – China Antitrust · SEC – NVIDIA FY2026 10-K · FTC – Arm Acquisition Termination

Teil IX – Einordnung und Wettbewerbsposition

🔵 NVIDIAs Geschichte lässt sich in fünf Thesen bündeln:

CUDA war der eigentliche Gründungsmoment des KI-Imperiums. Ohne CUDA, cuDNN und das Entwicklerökosystem wäre die GPU nur schnelle Hardware. Mit CUDA wurde sie Plattform.
Mellanox machte NVIDIA rack-scale. LLMs brauchen tausende GPUs; der Unterschied liegt im Netzwerk, in der Latenz, in Topologie, Kühlung und Orchestrierung. Mellanox war deshalb strategisch fast so wichtig wie A100/H100.
NVIDIA verkauft AI Factories, nicht nur Chips. Blackwell, Rubin, NVLink, Spectrum-X, BlueField, NIM, Dynamo, DGX Cloud und Omniverse ergeben eine Infrastrukturarchitektur.
NVIDIA ist Modellanbieter, aber nicht primär Modell-Labor. Nemotron, Cosmos und GR00T sind wichtig, weil sie den Stack erweitern und Anwendungsfelder öffnen; das Geschäftsmodell bleibt jedoch Compute, Software und Infrastruktur.
Dominanz erzeugt Gegenkräfte. Exportkontrollen, Kartellverfahren, Hyperscaler-ASICs, TSMC-Abhängigkeit, Energiebedarf und Kundenkonzentration sind reale Risiken. Gerade weil NVIDIA so zentral geworden ist, wird jede Abhängigkeit politisch und wirtschaftlich sichtbar.

Offene Fragen: Wie schnell und stabil skaliert Rubin? Wie stark ersetzen Hyperscaler eigene ASICs im Training und in der Inferenz? Wie viel China-Umsatz bleibt dauerhaft erreichbar? Kann NVIDIA den CUDA-/NVLink-/Dynamo-Moat offen genug halten, ohne Kontrolle zu verlieren? Und wie lange tragen AI-Factory-Investitionen diese Bewertungsdimension?

Quellenverzeichnis

Ursprung, CUDA und Deep Learning

Hardware, Netzwerk und Plattform

Software, Modelle und Robotik

Finanzen, Deals und Regulierung

Letzte Aktualisierung: 6. Juni 2026. Leistungs-, Benchmark- und Roadmapangaben von NVIDIA wurden als Firmenangaben behandelt. Börsenwert, Kundendeals, Exportregeln und China-Umsätze sind zeitabhängig und sollten bei neuen Quartalszahlen oder Regulierungsentscheidungen aktualisiert werden.