Die Google I/O 2025: Gemini auf dem Vormarsch

Die Google I/O – jedes Jahr wieder ein absolutes Highlight für Tech-Fans, oder? So ein bisschen wie das Barometer für die neuesten Entwicklungen. Und dieses Jahr, die Google I/O 2025, hat mal wieder eindrucksvoll bewiesen: Wir stecken mittendrin in einer riesigen Veränderung – der sogenannten Gemini-Ära. Was vor ein paar Jahren noch wie ein ambitioniertes Projekt klang, ist heute die treibende Kraft, die nicht nur Googles Produkte auf den Kopf stellt, sondern auch unsere Vorstellung von der Zukunft der Künstlichen Intelligenz. In diesem ausführlichen Beitrag tauchen wir gemeinsam tief in die spannendsten Ankündigungen der Google I/O 2025 ein. Wir schauen uns an, wie Google die Grenzen der KI immer weiter verschiebt und diese krassen Fortschritte für jeden von uns nutzbar macht. Bereit?

Ein Jahr des Wahnsinns-Wachstums: Gemini 2.5 und darüber hinaus

Sundar Pichai hat die Keynote ja gleich mit einer klaren Ansage eröffnet: In der Gemini-Ära geht’s ums rasante Tempo. Die besten Modelle? Die werden nicht mehr ewig für die I/O aufgehoben, sondern fließen kontinuierlich in die Produkte ein. Und Leute, der Fortschritt seit der letzten I/O ist schlichtweg atemberaubend. Stellt euch vor: Die Elo-Scores der Gemini Pro Modelle haben sich seit der ersten Generation um über 300 Punkte verbessert! Und bei der I/O 2025? Da wurde Gemini 2.5 Pro als der unangefochtene Spitzenreiter der LM Arena-Bestenliste in allen Kategorien gefeiert. Das ist mal ein klares Signal, wer hier gerade die Nase vorn hat in der KI-Forschung und -Entwicklung, oder?

Besonders beeindruckend finde ich die Entwicklung im Coding-Bereich. Das aktualisierte Gemini 2.5 Pro hat nicht nur den ersten Platz auf der WebDev Arena erobert, sondern die vorherige Version um satte 142 Elo-Punkte übertroffen. Und die Entwickler-Community? Die nimmt das Ding mit offenen Armen auf! Auf Plattformen wie Cursor, einem Top-KI-Code-Editor, ist Gemini das am schnellsten wachsende Modell des Jahres und spuckt Hunderttausende von Codezeilen pro Minute aus. Das Beispiel, dass Gemini Pokémon Blau erfolgreich durchgespielt hat – ja, richtig gehört, Pokémon! – zeigt auf super unterhaltsame Weise, wie weit die Fähigkeiten des Modells schon reichen.

Dieser explosive Fortschritt wäre ohne Googles erstklassige Infrastruktur gar nicht möglich. Die siebte Generation der TPUs, Codename Ironwood, wurde extra fürs Denken und Inferieren in riesigem Maßstab entwickelt und liefert eine zehnfache Leistungssteigerung gegenüber der Vorgänger-Generation. Diese Power ermöglicht es Google, Modelle viel schneller und gleichzeitig günstiger anzubieten. Kein Wunder, dass die Top-Modelle auf der LM Arena-Bestenliste – alle von Gemini, wohlgemerkt – die ersten drei Plätze bei der Anzahl der generierten Tokens pro Sekunde belegen.

Die Auswirkungen dieser Fortschritte spüren wir schon jetzt im Alltag. Die monatlich verarbeiteten Tokens über alle Produkte und APIs hinweg sind in nur einem Jahr von 9,7 Billionen auf 480 Billionen gestiegen – das ist eine 50-fache Zunahme! Auch die Akzeptanz der Entwickler-KI-Tools ist explodiert: Über 7 Millionen Entwickler haben schon mit der Gemini API experimentiert, ein Wachstum von über 500 % seit der letzten I/O. Die Gemini App hat über 400 Millionen monatlich aktive Nutzer, und die Nutzung von 2.5 Pro in der App ist um 45 % gestiegen. Und die KI-Übersichten in der Google Suche? Die erreichen schon über 1,5 Milliarden Nutzer pro Monat und machen Google Search damit zum Produkt, das generative KI weltweit am meisten Menschen zugänglich macht. Wahnsinn, oder?

Von der Forschung zur Realität: Drei wegweisende Projekte, die jetzt im Alltag ankommen

Aber genug geredet von Zahlen und Scores. Was bedeutet das alles konkret für uns? Google hat auf der I/O 2025 drei Forschungsprojekte vorgestellt, die jetzt endlich in Produkte für uns alle fließen. Das ist der Moment, wo KI wirklich im Alltag ankommt. Nennt sie Project Starline, Astra und Mariner – und sie sind jetzt Google Beam, Gemini Live und Agentic Capabilities.

Erinnert ihr euch an Project Starline? Dieses coole Ding, das uns das Gefühl geben sollte, wirklich zusammen in einem Raum zu sein, auch wenn wir meilenweit entfernt sind? Das wird jetzt mit Google Beam auf die nächste Stufe gehoben! Stellt euch vor: Eine KI-gestützte Videokommunikation, die 2D-Videos in ein super realistisches 3D-Erlebnis verwandelt. Mit sechs Kameras und cleverer KI wird euer Kopf quasi perfekt in Echtzeit erfasst. Die ersten Google Beam-Geräte sollen noch dieses Jahr kommen – wie cool ist das denn? Und die Technologie dahinter steckt übrigens schon länger in Google Meet, zum Beispiel bei den Echtzeit-Sprachübersetzungen. Sprachbarrieren? Wer braucht die noch!

Project Astra, das die Idee eines universellen KI-Assistenten erforscht, der die Welt um sich herum verstehen kann, wird nun in Gemini Live integriert. Die Kamera- und Bildschirmfreigabefunktionen von Project Astra ermöglichen es uns, über alles zu sprechen, was wir gerade sehen. Und das Beste? Diese Funktion wird ab sofort für alle Nutzer auf Android und iOS ausgerollt. Eine super lustige Demo zeigte, wie Gemini Live selbst bei den skurrilsten Interpretationen der Realität (ein Müllwagen als Cabrio, eine Straßenlaterne als Gebäude) geduldig und korrekt reagiert hat. Das war echt zum Schmunzeln!

Und Project Mariner? Dieser Agent, der mit dem Web interagieren und Aufgaben für uns erledigen kann, bringt seine Fähigkeiten jetzt in die Gemini API und wird diesen Sommer breiter verfügbar sein. Mariner kann jetzt bis zu 10 gleichzeitige Aufgaben im Auge behalten und hat eine „Teach and Repeat“-Funktion. Das heißt, der Agent lernt eine Aufgabe einmal und erstellt dann einen Plan, wie er ähnliche Aufgaben in Zukunft selbstständig erledigen kann. Diese „Agentic Capabilities“ sind Teil eines größeren Plans von Google, ein offenes Ökosystem zu schaffen, mit einem Protokoll, das Agenten miteinander kommunizieren lässt, und der Kompatibilität des Gemini SDK mit anderen Tools. Klingt nach echtem Fortschritt, oder?

Die Zukunft der Suche

Okay, jetzt zum absoluten Herzstück von Google: der Suche! Die wird durch die Gemini-Modelle ja mal so richtig auf links gedreht. Diese KI-Übersichten, die schon über 1,5 Milliarden Nutzer erreichen , waren nur der Anfang. Sie haben schon gezeigt, wie hilfreich KI bei komplexen oder visuellen Suchanfragen sein kann.

Aber der nächste Schritt ist der neue AI Mode. Das ist quasi eine komplette Neuerfindung der Suche, mit viel clevererem „Denken“. Ihr könnt viel längere, komplexere Fragen stellen und dann mit Folgefragen immer tiefer einsteigen. Das Beste? Der AI Mode wird ab sofort in den USA ausgerollt und bekommt einen eigenen Tab direkt in der Suche. Wie praktisch ist das denn?

Die Magie dahinter? Eine Technik namens Query Fanout. Wenn eure Frage ein bisschen mehr Hirnschmalz braucht, erkennt die Suche das und schickt eine spezielle Gemini-Version los, die eure Frage in kleinere Teile zerlegt und gleichzeitig ganz viele Suchanfragen im Web startet. So bekommt ihr eine viel tiefere, umfassendere Antwort.

Und in Zukunft wird der AI Mode noch persönlicher! Wenn ihr zustimmt, kann er relevante Infos aus anderen Google Apps einbeziehen, angefangen bei Gmail. Stellt euch vor, personalisierte Vorschläge basierend auf euren letzten Suchen oder sogar die Integration von E-Mails, um zum Beispiel Reisepläne zu synchronisieren. Super praktisch!

Die Integration von Project Mariner bringt die Agentic Capabilities in den AI Mode. Das heißt, die Suche kann Aufgaben für euch übernehmen! Zum Beispiel Konzerttickets suchen oder Restaurantreservierungen machen, indem sie Formulare ausfüllt und Optionen vergleicht. Das spart doch echt Zeit, oder?

Auch die Multimodalität wird auf die nächste Stufe gehoben. Mit der Integration von Project Astra’s Live-Fähigkeiten in den AI Mode wird Search Live eingeführt. Ihr könnt eure Kamera nutzen, um der Suche zu zeigen, was ihr seht, und bekommt in Echtzeit hilfreiche Infos. Eine echt beeindruckende Demo zeigte, wie Search Live bei wissenschaftlichen Experimenten, der Identifizierung von Pflanzen oder der Reparatur von Gegenständen helfen kann. Das ist doch mal ein Game Changer!

Und das Einkaufen? Das wird durch den AI Mode ebenfalls revolutioniert. Die Suche integriert visuelle Inspiration aus Google Images und das riesige Angebot an Produkten und Händlern aus dem Shopping Graph. Ihr bekommt personalisierte Vorschläge, könnt Produkte nach euren Bedürfnissen filtern und sogar eine neue Try On-Funktion nutzen, um Kleidung virtuell anzuprobieren. Und eine neue Agentic Checkout-Funktion? Die lässt die Suche den Kaufprozess übernehmen, sobald der Preis stimmt. Klingt fast zu schön, um wahr zu sein!

Gemini App: Der persönliche, proaktive und leistungsstarke Assistent für 2025

Die Gemini App – das wird der zentrale Anlaufpunkt für die Interaktion mit unserem KI-Assistenten. Das Ziel ist ambitioniert, aber klingt super: Gemini soll unser persönlichster, proaktivster und leistungsstärkster Helfer werden.

Die schon erwähnten Gemini Live-Funktionen mit Kamera und Bildschirm teilen? Die kommen jetzt kostenlos für alle auf Android und iOS. Und in Zukunft? Da wird Gemini Live mit anderen Google Apps wie Kalender, Maps, Keep und Tasks verknüpft. Stellt euch vor, wie proaktiv das werden kann!

Deep Research in der Gemini App wird erweitert, sodass ihr eigene Dateien hochladen könnt und zukünftig sogar in Google Drive und Gmail recherchieren lassen könnt.

Canvas, dieser interaktive Bereich für die gemeinsame Erstellung in Gemini, wird noch mächtiger. Ihr könnt Berichte in dynamische Webseiten, Infografiken, Quizze oder sogar benutzerdefinierte Podcasts verwandeln. Und mit der Vibe Code-Funktion könnt ihr interaktive Simulationen und andere kreative Projekte erstellen. Das klingt nach ganz neuen Möglichkeiten!

Gemini in Chrome wird als KI-Assistent eingeführt, der euch beim Surfen zur Seite steht und den Kontext der aktuellen Seite versteht. Super praktisch beim Surfen! Diese Funktion wird diese Woche für Gemini-Abonnenten in den USA ausgerollt.

Die Bildgenerierung in der Gemini App wird mit Imagine 4 auf eine neue Stufe gehoben. Die Bilder sind detailreicher, die Farben nuancierter und die Textgenerierung ist deutlich verbessert. Und eine superschnelle Variante von Imagine 4? Die ist zehnmal schneller als das Vorgängermodell. Wahnsinn!

Aber die Videogenerierung – die wird mit V3 echt revolutioniert. V3 bietet nicht nur eine bessere visuelle Qualität und ein stärkeres Verständnis der Physik, sondern auch eine native Audio-Generierung. Das heißt, Charaktere können sprechen, und die Videos bekommen realistische Soundeffekte und Hintergrundgeräusche. Das ist ein riesiger Schritt!

Generative Medien: Kreativität neu definieren im Jahr 2025

Generative Medien – das ist ein Feld, das die Grenzen der Kreativität gerade neu definiert. Google arbeitet hier super eng mit Künstlern zusammen, um Technologien zu entwickeln, die ihren kreativen Prozess unterstützen. Lyria 2 zum Beispiel, für Musik und professionelles Audio – das ist jetzt für Unternehmen, YouTuber und Musiker verfügbar.

Und weil das Thema KI-generierte Inhalte auch Fragen aufwirft, setzt Google weiter auf SynthID, dieses unsichtbare Wasserzeichen. Das wurde erweitert, und es gibt jetzt sogar einen SynthID-Detektor, der Wasserzeichen in verschiedenen Medienformaten erkennen kann. Super wichtig, finde ich!

Die Zusammenarbeit mit Filmemachern hat zur Entwicklung von Vio als Filmwerkzeug geführt. Vio ermöglicht es Filmemachern, Live-Action-Aufnahmen mit KI-generierten Videos zu mischen und so ganz neue Erzählmöglichkeiten zu erschließen.

Basierend auf dieser Zusammenarbeit kam Flow – ein neues KI-Filmmaking-Tool, das Vio, Imagine und Gemini vereint. Stellt euch vor, wie viel einfacher es wird, Ideen umzusetzen, Charaktere und Szenen konsistent zu halten und präzise Kameraanweisungen zu geben. Echt spannend, was da alles möglich wird!

Google AI Abonnements: Pro und Ultra für die Zukunft der KI

Okay, all diese super fortschrittlichen KI-Funktionen – wie kommen wir da ran? Google hat dafür zwei neue Abo-Pläne vorgestellt: Google AI Pro und das neue Google AI Ultra. Der Pro-Plan ist quasi das Rundum-Paket mit vielen KI-Produkten, höheren Ratenlimits und speziellen Funktionen. Der Ultra-Plan? Der ist für die echten Pioniere unter uns, mit den höchsten Ratenlimits, dem allerersten Zugang zu neuen Features und sogar Extras wie YouTube Premium und viel Speicherplatz. Klingt fair, oder?

Android XR: KI in der physischen Welt im Jahr 2025

Android XR – das ist Googles Antwort darauf, KI so richtig in unsere physische Welt zu bringen. Das ist die erste Android-Plattform, die komplett in der Gemini-Ära entwickelt wurde und auf allem laufen soll, von Headsets bis zu superleichten Brillen. Google glaubt nicht an „eine Lösung für alle“ bei XR, und das finde ich gut! Sie entwickeln Geräte für ganz verschiedene Zwecke.

Auf Headsets, wie Samsungs Project Muhan, könnt ihr Gemini nutzen, um quasi eine unendliche Leinwand für Apps zu haben oder mit Google Maps in XR zu interagieren. Klingt nach Science-Fiction, oder?

Aber die leichten Brillen mit Android XR – die sind für den ganzen Tag gedacht. Kamera, Mikros, optionales Display im Glas… damit kann Gemini die Welt sehen und hören und uns super hilfreiche Infos geben. Die Live-Demo auf der I/O war echt der Hammer! Zu sehen, wie die Brillen im Backstage-Chaos bei der Navigation, Objekterkennung und Echtzeit-Übersetzung geholfen haben – das war beeindruckend.

Google arbeitet hier eng mit Samsung zusammen, um Android XR über Headsets hinaus auf Brillen auszuweiten und eine Software- und Referenzhardware-Plattform für das Ökosystem zu schaffen. Und sie wollen auch mit Modefirmen wie Gentle Monster und Warby Parker kooperieren, damit die Brillen auch noch stylisch aussehen. Super Idee!

Die Zukunft ist jetzt: KI für eine bessere Welt im Jahr 2025

Puh, das war ganz schön viel, oder? Aber die Google I/O 2025 hat eins ganz klar gezeigt: Die Gemini-Ära ist nicht nur eine Tech-Revolution, sondern hat das Potenzial, unsere Welt wirklich positiv zu verändern. Beispiele wie Firesat, das Waldbrände erkennt, oder der Einsatz von KI-Drohnen bei Hurrikanen – das zeigt, wie KI schon heute Leben retten und uns helfen kann.

Und die Forschung von heute? Die wird in ein paar Jahren Realität! Denkt nur an die nächste Generation von Robotern, neue Medikamente, fehlerkorrigierte Quantencomputer oder komplett autonome Autos.

Sundar Pichai hat die Keynote ja mit einer persönlichen Geschichte beendet, über eine Fahrt im Waymo mit seinen Eltern. Das hat mich echt berührt und daran erinnert, wie Technologie uns inspirieren, begeistern und voranbringen kann. Die Google I/O 2025 war ein eindrucksvolles Zeugnis dieser Kraft und ein Blick in eine Zukunft, in der KI nicht nur ein Werkzeug ist, sondern ein fester Teil unseres Lebens. Sie hilft uns zu lernen, kreativ zu sein und die Welt besser zu verstehen. Die Möglichkeiten, die sich da auftun, sind einfach unendlich und super aufregend! Ich bin schon total gespannt, was Entwickler und Tech-Begeisterte in dieser neuen KI-Ära alles auf die Beine stellen werden.

Beitrag veröffentlicht

21. Mai 2025

Digital

von

Jakob Hauer

Schlagwörter:

Google I/O, google io 2025