Die Geschichte von Google AI
Von DeepMind und dem Transformer über AlphaFold bis Gemini 3.5 — Forschung, Produkte und Kontroversen.
Konfidenz-Kennzeichnung
- ✅ Faktum (belegt)
- 🟡 teilweise belegt
- 🔵 Interpretation
Kategorien
- Unternehmen
- Forschung
- Sicherheit
- Modell
- Produkt
- Kontroverse
Zeitleiste
Sechs Kapitel von DeepMind bis Gemini 3. Filtere nach Kategorie oder durchsuche alle Ereignisse — jeder Eintrag führt seine Quellen mit.
Ursprung: DeepMind, Brain & AlphaGo
Zwei Wurzeln, TensorFlow und der AlphaGo-Moment, der die Welt aufhorchen ließ.
Gründung von DeepMind in London
Demis Hassabis, Shane Legg und Mustafa Suleyman gründen DeepMind als KI-Startup in London mit dem Fernziel, Intelligenz zu „lösen“. Hassabis und Legg kannten sich von der Gatsby-Unit am UCL.
Google Brain entstehtDistBelief
Jeff Dean, Greg Corrado und Andrew Ng starten innerhalb von Google X das Deep-Learning-Projekt Google Brain und bauen DistBelief, den verteilten Vorläufer von TensorFlow.
„Cat Paper“: unüberwachtes Lernen im großen Maßstab
Ein Google-Brain-Netz aus 16.000 Prozessoren lernt aus 10 Mio. unbeschrifteten YouTube-Bildern eigenständig, Katzen zu erkennen — ein vielbeachteter Meilenstein des unüberwachten Repräsentationslernens.
DeepMind: DQN lernt Atari aus PixelnDQN
DeepMinds Deep Q-Network lernt Atari-Spiele direkt aus rohen Bildpunkten und schlägt in mehreren Spielen menschliche Experten — der Startschuss für Deep Reinforcement Learning.
Google übernimmt DeepMind
Google kauft DeepMind für rund 400–650 Mio. USD; das Labor bleibt eigenständig in London. Die Übernahme macht Google zu einem Schwergewicht der KI-Forschung.
DQN in Nature: menschliches SpielniveauDQN
„Human-level control through deep reinforcement learning“ zeigt, dass ein einziges Netz mit gleicher Architektur in 49 Atari-Spielen menschliches Niveau erreicht — ein Paradigmenwechsel im RL.
TensorFlow wird Open SourceTensorFlow
Google veröffentlicht TensorFlow, den Nachfolger von DistBelief, unter Apache-2.0. Die Bibliothek läuft auf CPU/GPU/TPU und wird zur weltweit meistgenutzten Deep-Learning-Plattform.
Der Moment, in dem die Welt zusah, wie eine Maschine Go-Intuition zeigte.
AlphaGo schlägt Lee Sedol 4:1AlphaGo
In Seoul besiegt AlphaGo den Go-Weltklassespieler Lee Sedol 4:1 vor insgesamt über 200 Mio. Zuschauern (Medienreichweite über alle Spiele) — Jahre früher als erwartet. Partie 2 (Zug 37) gilt als Sinnbild kreativer Maschinen-Intuition.
Über fünf Partien in Seoul besiegte AlphaGo den Weltklassespieler Lee Sedol 4:1, verfolgt von insgesamt über 200 Millionen Menschen (Medienreichweite über alle Spiele). „Zug 37“ in Partie 2 galt Experten als übermenschlich kreativ. Der Sieg kam rund ein Jahrzehnt früher, als viele für möglich gehalten hatten.
Im Kapitel weiterlesen →Tensor Processing Unit (TPU) vorgestelltTPU v1
Auf der Google I/O kündigt Sundar Pichai die selbst entwickelte TPU an — ein KI-Beschleuniger, der bereits im Rechenzentrum lief, u. a. beim AlphaGo-Match.
WaveNet revolutioniert SprachsyntheseWaveNet
DeepMinds WaveNet erzeugt Audio Sample für Sample und klingt deutlich natürlicher als bisherige Text-to-Speech-Systeme; später im Google Assistant im Einsatz.
Neuronales Google Translate (GNMT)GNMT
Google stellt Translate auf ein neuronales Ende-zu-Ende-System mit Attention um; die Übersetzungsqualität nähert sich erstmals menschlichem Niveau.
Transformer & AlphaFold
Die Architektur, die alles veränderte – und der gelöste Proteinfaltungs-Code.
Die Architektur, die alles veränderte — und später OpenAI beflügelte.
„Attention Is All You Need“ — der TransformerTransformer
Acht Google-Forscher stellen die Transformer-Architektur vor, die allein auf Attention beruht. Sie wird zur Grundlage von BERT, GPT, Gemini & nahezu allen großen Modellen — heute eines der meistzitierten Papiere des Jahrhunderts.
Acht Google-Forscher zeigten, dass ein Modell allein mit „Attention“ – ohne Rekurrenz oder Faltung – Sprache verarbeiten kann. Die Transformer-Architektur wurde zur Grundlage von BERT, GPT, Claude und Gemini. Die Ironie: Google legte das Fundament, auf dem OpenAIs ChatGPT Google später unter Druck setzte.
Im Kapitel weiterlesen →AlphaGo Zero — Meisterschaft ohne MenschenwissenAlphaGo Zero
AlphaGo Zero lernt Go allein durch Selbstspiel, ohne menschliche Partien, und übertrifft alle Vorgänger. Der Tabula-rasa-Ansatz gilt als konzeptioneller Durchbruch.
AlphaZero meistert Schach, Shogi und GoAlphaZero
AlphaZero generalisiert das Selbstspiel-Prinzip und übertrifft nach wenigen Stunden die besten spezialisierten Programme in Schach, Shogi und Go.
BERT — bidirektionales SprachverständnisBERT
Googles BERT nutzt einen bidirektionalen Transformer, setzt auf vielen NLP-Benchmarks neue Maßstäbe und wird 2019 in die Google-Suche integriert.
AlphaFold gewinnt CASP13AlphaFold 1
DeepMinds AlphaFold gewinnt den Proteinfaltungs-Wettbewerb CASP13 mit großem Vorsprung — der erste starke Hinweis, dass Deep Learning das 50 Jahre alte Faltungsproblem lösen könnte.
AlphaStar auf Grandmaster-Niveau (StarCraft II)AlphaStar
DeepMinds AlphaStar schlägt Top-Profis in StarCraft II und erreicht später Grandmaster — Multi-Agenten-RL in einem komplexen Echtzeit-Strategiespiel.
AlphaFold 2 löst das Proteinfaltungs-ProblemAlphaFold 2
Bei CASP14 erreicht AlphaFold 2 experimentnahe Genauigkeit (GDT ~92) — die Organisatoren erklären ein 50 Jahre altes Grundproblem der Biologie für gelöst.
Großmodelle & erste Risse
LaMDA, PaLM, Imagen, Gato – und die Lemoine-Debatte ums Bewusstsein.
LaMDA auf der Google I/O angekündigtLaMDA
Google stellt LaMDA vor, ein auf Dialog spezialisiertes Modell, und demonstriert es live in zwei Personas. Eine öffentliche Freigabe bleibt zunächst aus (Sicherheitsbedenken).
PaLM — 540-Milliarden-Parameter-ModellPaLM
Mit dem Pathways-System auf TPU-v4-Pods trainiert, erzielt PaLM (540 Mrd. Parameter) Spitzenwerte bei Few-Shot-Aufgaben und gehört zu den größten dichten Sprachmodellen seiner Zeit.
Gato — ein „generalist agent“Gato
DeepMinds Gato ist ein einziges Modell für über 600 Aufgaben — Atari, Bildunterschriften, Robotersteuerung, Chat — und entfacht die Debatte über den Weg zu allgemeiner Intelligenz.
Imagen — fotorealistische Text-zu-Bild-DiffusionImagen
Google Brains Imagen erzeugt fotorealistische Bilder aus Text und übertrifft DALL·E 2 auf COCO. Aus Missbrauchssorge wird es nicht öffentlich freigegeben.
Blake Lemoine: „LaMDA sei empfindungsfähig“LaMDA
Ein Google-Ingenieur behauptet öffentlich, LaMDA habe Bewusstsein. Google widerspricht, suspendiert und entlässt ihn später — eine vielzitierte Debatte über Anthropomorphisierung von KI.
AlphaFold-Datenbank: 200 Mio. Strukturen freiAlphaFold 2
DeepMind und EMBL-EBI stellen über 200 Millionen vorhergesagte Proteinstrukturen offen bereit — nahezu jedes katalogisierte Protein. Eines der wichtigsten offenen Datenangebote der Biologie.
AlphaTensor findet schnellere MatrixmultiplikationAlphaTensor
Auf AlphaZero aufbauend entdeckt AlphaTensor neue, schnellere Algorithmen für die Matrixmultiplikation — das erste KI-System, das nachweislich neue korrekte Algorithmen findet.
Bard, die Fusion & Gemini
Der holprige Bard-Start, die Fusion zu Google DeepMind und Gemini 1.0.
Google kündigt Bard anBard
Als Antwort auf ChatGPT stellt Sundar Pichai den auf LaMDA basierenden Chatbot Bard vor — zunächst nur für ausgewählte Tester.
Ein einziger Faktenfehler — und 100 Milliarden Dollar lösen sich auf.
Bard-Demofehler kostet ~100 Mrd. USD BörsenwertBard
In einem Werbespot behauptet Bard fälschlich, das James-Webb-Teleskop habe das erste Exoplaneten-Foto gemacht. Die Alphabet-Aktie verliert ~7,7 % — rund 100 Mrd. USD Marktwert.
In einem Werbespot behauptete Bard fälschlich, das James-Webb-Teleskop habe das erste Foto eines Exoplaneten aufgenommen – das gelang anderen Teleskopen bereits 2004. Die Alphabet-Aktie fiel um rund 7,7 %, etwa 100 Mrd. USD Börsenwert. Der Fehltritt prägte das Bild, Google sei im KI-Rennen zurückgefallen.
Im Kapitel weiterlesen →Bard startet öffentlich (USA & UK)Bard
Google öffnet Bard über eine Warteliste für Nutzer in den USA und Großbritannien, weiterhin auf LaMDA-Basis und mit Hinweis auf mögliche Fehler.
Google Brain und DeepMind fusionieren
Alphabet vereint Brain und DeepMind zu „Google DeepMind“; Demis Hassabis wird CEO, Jeff Dean Chief Scientist. Ziel: den KI-Fortschritt im Wettlauf bündeln und beschleunigen.
PaLM 2 auf der Google I/OPaLM 2
PaLM 2 erscheint in vier Größen, beherrscht 100+ Sprachen und wird sofort in über 25 Produkte (u. a. Bard) integriert.
Gemini erstmals angekündigtGemini
Pichai kündigt Gemini als von Grund auf multimodales Nachfolgemodell von Google DeepMind an, das PaLM 2 ablösen soll.
Search Generative Experience (SGE)
Google bringt generative KI-Antworten testweise in die Suche (Search Labs) — der Vorläufer der späteren AI Overviews und des AI Mode.
AlphaDev findet schnellere SortieralgorithmenAlphaDev
DeepMinds AlphaDev entdeckt per RL schnellere Sortier-Routinen in Assembler; die Ergebnisse fließen in die C++-Standardbibliothek ein — die erste KI-Ergänzung seit über einem Jahrzehnt.
Duet AI für Workspace verfügbarPaLM 2
Generative Funktionen ziehen in Gmail, Docs, Sheets, Slides & Meet ein. Duet AI wird später in „Gemini for Workspace“ umbenannt.
Gemini 1.0 (Ultra, Pro, Nano)Gemini 1.0
Google veröffentlicht Gemini 1.0 in drei Größen. Ultra erreicht als erstes Modell 90,0 % auf MMLU (über menschlichem Experten-Schnitt); Bard läuft fortan auf Gemini Pro.
Kontroverse um geschönte Gemini-DemoGemini 1.0
Das gefeierte Gemini-Demo-Video war nicht echtzeitlich: Google nutzte Standbilder und Textprompts. Das Unternehmen räumt die Inszenierung ein — ein Dämpfer für den Launch.
Gemini wächst — und stolpert
1M-Kontext, Gemma, AlphaFold 3, Nobelpreis – und zwei öffentliche Pannen.
Bard wird zu Gemini; Gemini Advanced startetGemini Ultra 1.0
Google benennt Bard in Gemini um und bündelt seine KI-Marke. Gemini Advanced (mit Ultra 1.0) startet als Abo im Google One AI Premium Plan.
Gemma — offene ModelleGemma
Google DeepMind veröffentlicht Gemma (2B/7B) als frei verfügbare, leichte offene Modelle auf Basis der Gemini-Forschung.
Gemini 1.5 Pro — 1-Mio.-Token-KontextGemini 1.5 Pro
Mit Mixture-of-Experts verarbeitet Gemini 1.5 Pro bis zu 1 Mio. Token — damals das längste Kontextfenster eines öffentlich verfügbaren Großmodells.
Gut gemeint, schlecht kalibriert: Wie ein Bias-Filter zum PR-Debakel wurde.
Gemini-Bildgenerierung pausiert nach KontroverseGemini
Nach historisch falschen, „übermäßig diversen“ Personenbildern (z. B. zu klar historischen Anfragen) pausiert Google die Funktion und entschuldigt sich. Der Schaden war vor allem ein Reputations- und Vertrauensverlust — anders als beim Bard-Demofehler 2023 kein nennenswerter Börseneinbruch.
Um Einseitigkeit zu vermeiden, war Gemini darauf getrimmt, vielfältige Personen zu zeigen – auch dort, wo der historische Kontext eindeutig war (etwa Soldaten von 1943 oder US-Gründerväter). Google pausierte die Personen-Bildgenerierung, entschuldigte sich und überarbeitete den Ansatz. Anders als beim Bard-Demofehler 2023 löste die Panne keinen nennenswerten Börseneinbruch aus; der Schaden war vor allem ein Reputationsverlust.
Im Kapitel weiterlesen →AlphaFold 3 — alle BiomoleküleAlphaFold 3
AlphaFold 3 (mit Isomorphic Labs) modelliert nicht nur Proteine, sondern auch DNA, RNA, Liganden und Ionen samt Wechselwirkungen — ein Sprung für Biologie und Pharmaforschung.
I/O 2024: Project Astra, Veo, Imagen 3Gemini
Google zeigt den universellen Echtzeit-Assistenten Project Astra, das Videomodell Veo und den Bildgenerator Imagen 3 — zunächst als Preview.
AI Overviews in der Suche — und PannenGemini
KI-Zusammenfassungen über den Suchergebnissen starten in den USA — und sorgen mit absurden Ratschlägen (Kleber auf Pizza) rasch für Spott; Google bessert nach.
AlphaProof & AlphaGeometry 2: IMO-SilberAlphaProof / AlphaGeometry 2
DeepMinds Systeme lösen vier von sechs Aufgaben der Mathematik-Olympiade 2024 — Silbermedaillen-Niveau, nur einen Punkt unter Gold.
Erstmals führt KI-Arbeit direkt zu einem Nobelpreis.
Nobelpreis Chemie für AlphaFoldAlphaFold 2
Demis Hassabis und John Jumper erhalten (mit David Baker) den Chemie-Nobelpreis 2024 für AlphaFold — das erste Mal, dass ein KI-System direkt zu einem Nobelpreis führt.
Die Königlich Schwedische Akademie verlieh den Chemie-Nobelpreis 2024 an Demis Hassabis und John Jumper (Google DeepMind) für AlphaFold 2 sowie an David Baker für Proteindesign. Über zwei Millionen Forschende nutzten AlphaFold bereits – das erste Mal, dass KI-Arbeit direkt mit einem Nobelpreis ausgezeichnet wurde.
Im Kapitel weiterlesen →Gemini 2.0 Flash — die „agentische Ära“Gemini 2.0 Flash
Google stellt Gemini 2.0 Flash vor (native Bild-/Audioausgabe, Tool-Use) und ruft die „agentische Ära“ aus — Modelle, die mehrere Schritte vorausplanen und handeln.
Project Mariner — Agent im BrowserGemini 2.0
DeepMinds Forschungsprototyp Mariner steuert den Chrome-Browser autonom (Formulare, Suche, Einkauf) und erreicht 83,5 % im WebVoyager-Benchmark.
Reasoning, Agenten & Gemini 3
Thinking-Modelle, IMO-Gold und der Sprung an die Spitze mit Gemini 3.
Gemini 2.0 Flash wird Standard + CanvasGemini 2.0 Flash
Gemini 2.0 Flash (inkl. „Flash Thinking“ mit sichtbarem Reasoning) wird Standard in der Gemini-App; das Canvas-Feature bringt kollaboratives Schreiben und Coding.
AI Co-Scientist — Mehragenten-ForschungspartnerCo-Scientist
Ein Mehragenten-System auf Gemini 2.0 generiert und verfeinert wissenschaftliche Hypothesen; es schlägt u. a. neue Wirkstoffkandidaten und Resistenz-Mechanismen vor.
Gemini 2.5 Pro — erstes offizielles „Thinking Model“Gemini 2.5 Pro
Gemini 2.5 Pro denkt vor der Antwort strukturiert nach und führt mehrere Reasoning-Benchmarks an; verfügbar über AI Studio und Gemini Advanced.
AI Mode in der Google-SucheGemini 2.0
Google rüstet AI Overviews auf Gemini 2.0 auf und startet einen experimentellen „AI Mode“ — einen dialogorientierten Suchmodus für komplexe, mehrstufige Fragen.
AlphaEvolve — Coding-Agent entdeckt AlgorithmenAlphaEvolve
AlphaEvolve kombiniert Gemini Flash und Pro, optimiert Googles Rechenzentren und Trainings-Kernel und verbessert sogar Strassens Matrixmultiplikations-Rekord von 1969.
I/O 2025: Veo 3 (mit Audio), Imagen 4, AI UltraVeo 3 / Imagen 4
Veo 3 erzeugt erstmals Video samt Ton in einem Schritt; dazu Imagen 4 und das Premium-Abo „Google AI Ultra“ (249,99 USD/Monat) mit Deep Think und Mariner.
Gemini 2.5 FlashGemini 2.5 Flash
Gemini 2.5 Flash verbindet Reasoning mit der Geschwindigkeit der Flash-Reihe; im Juni folgt die allgemeine Verfügbarkeit auf Vertex AI. Es treibt u. a. den AI Mode an.
Gemini Deep Think erreicht IMO-GoldGemini Deep Think
Eine Deep-Think-Version von Gemini erzielt bei der Mathematik-Olympiade 2025 Goldmedaillen-Niveau (35/42) unter regulären Bedingungen — ein Jahr nach Silber.
Antitrust-Urteil: Remedies, aber kein Zwangsverkauf
Richter Mehta verbietet Google exklusive Such-Deals und ordnet Daten-Teilung an, lehnt aber eine Abspaltung von Chrome/Android ab. Google darf weiter (nicht-exklusiv) für Vorinstallation zahlen; beide Seiten kündigen Berufung an.
Die Aufholjagd gelingt — und löst bei OpenAI angeblich „Code Red“ aus.
Gemini 3 — Flaggschiff mit Day-one in der SucheGemini 3 Pro / Deep Think
Gemini 3 Pro führt Bestenlisten an (1501 Elo auf LMArena, 91,9 % GPQA Diamond) und kommt mit Deep-Think-Modus; erstmals integriert Google ein Modell vom ersten Tag an in den Such-AI-Mode. Dazu: die Agentenplattform Google Antigravity.
Gemini 3 Pro führte Bestenlisten an (1501 Elo auf LMArena) und wurde erstmals am ersten Tag direkt in die Google-Suche integriert; dazu kamen ein Deep-Think-Modus und die Agentenplattform Antigravity. Berichten zufolge löste der Sprung bei OpenAI einen internen „Code Red“ aus – Googles Aufholjagd vom Bard-Debakel zur Spitze war vollzogen.
Im Kapitel weiterlesen →OpenAI ruft „Code Red“ nach Gemini 3 ausGemini 3
Berichten zufolge erklärt Sam Altman intern „Code Red“, weil Gemini 3 OpenAI in mehreren Benchmarks übertrifft. Gemini meldet zu diesem Zeitpunkt ~650 Mio. monatliche App-Nutzer.
Gemini 3 FlashGemini 3 Flash
Kurz nach Gemini 3 Pro bringt Google das schnelle, günstige Gemini 3 Flash — frontier-nahe Leistung bei hohem Tempo, ausgelegt für Agenten und Alltagsaufgaben in App, Suche und API.
Gemini 3.1 Pro — großer Reasoning-SprungGemini 3.1 Pro
Gemini 3.1 Pro (erstes „.1“-Update der Reihe) verdoppelt das Reasoning gegenüber 3 Pro: auf ARC-AGI-2 springt es von 31,1 % auf 77,1 % — bei gleichem Preis.
I/O 2026: Gemini 3.5 Flash & Gemini OmniGemini 3.5 Flash / Omni
Gemini 3.5 Flash verbindet Frontier-Intelligenz mit Agenten-Tempo (4× schneller) und übertrifft 3.1 Pro bei Coding/Agentik; dazu das video-multimodale Gemini Omni und Android-XR-Brillen. Gemini 3.5 Pro war zu diesem Zeitpunkt offiziell angekündigt, aber noch nicht veröffentlicht.
Acht ausführliche Teile mit Quellenkritik, Datierung und Einordnung — auf einer eigenen, ruhigen Leseseite.
