Google präsentiert neue Version seines KI-Modells Gemini

Google-Gemini_2.0-keyword_header.width-1200.format-webp

Bild: Google

Google hat die nächste Generation seines KI-Modells Gemini angekündigt. Gemini 2.0 soll signifikante Verbesserungen beim Verständnis von Kontext und Zusammenhängen sowie bei der Interaktion mit Nutzern bieten.

Neu ist die Fähigkeit, neben verschiedenen Eingabeformaten auch Bilder und gesprochene Sprache auszugeben sowie eigenständig Tools und Funktionen zu nutzen – damit wird Gemini multimodal und tritt in die Fußstapfen von OpenAIs Konkurrenzmodell GPT-4o.

Entwickler können ab sofort mit der ersten Variante, Gemini 2.0 Flash, arbeiten. In Benchmarks übertrifft sie das Vorgängermodell Gemini 1.5 bei doppelter Verarbeitungsgeschwindigkeit. Nutzer der Gemini-App haben ebenfalls weltweit bereits Zugriff auf eine experimentelle Chat-Version von Gemini 2.0 Flash. In naher Zukunft soll das Modell auch in weitere Google-Dienste wie die Websuche integriert werden.

Parallel dazu erforscht Google anhand mehrerer Prototypen die Einsatzmöglichkeiten von KI-Agenten auf Basis von Gemini 2.0:

Project Astra soll als universeller digitaler Assistent fungieren, auch auf AR-Brillen.

Project Mariner unterstützt Nutzer direkt im Browser bei komplexen Aufgaben.

Der Entwicklungs-Agent Jules assistiert Programmierern auf der Plattform GitHub.

Einen Schwerpunkt setzt Google beim Einsatz von Gemini 2.0 in Videospielen. Dank verbessertem Kontext-Verständnis und Reasoning verspricht sich das Unternehmen realistischere Spiel-Erlebnisse. In Zusammenarbeit mit großen Spielestudios wie Supercell entstehen derzeit Gaming-Assistenten, die als intelligente Begleiter fungieren sollen.

Die KI-Agenten analysieren das Spielgeschehen in Echtzeit, geben konkrete Handlungsvorschläge und greifen bei Bedarf auf zusätzliches Wissen aus Websuchen zurück. Die räumlichen Analyse-Fähigkeiten von Gemini 2.0 kommen dabei in Strategiespielen wie „Clash of Clans“ ebenso zum Einsatz wie in Aufbau-Games à la „Hay Day“.

Laut Google stellt Gemini 2.0 einen wichtigen Schritt auf dem Weg zur „Artificial General Intelligence“, also einer KI mit menschenähnlichen kognitiven Fähigkeiten, dar.

Die heutigen Veröffentlichungen markieren ein neues Kapitel für unser Gemini-Modell. Mit der Veröffentlichung von Gemini 2.0 Flash und der Reihe von Forschungsprototypen, welche die Möglichkeiten von KI-Agenten erkunden, haben wir einen aufregenden Meilenstein in der Gemini-Ära erreicht. Wir freuen uns darauf, weiterhin alle neuen Möglichkeiten sicher zu erkunden, während wir auf AGI (Artificial General Intelligence) hinarbeiten.

Google

Kommentar verfassen

Bleibt bitte nett zueinander!