Google hat Veo, ein KI-Modell zur Generierung von Videos aus Text- und Bildvorgaben, als Private Preview auf seiner vor allem an Unternehmen gerichtete Cloud-Plattform Vertex AI veröffentlicht. Entwickelt wurde das System von der Google-Tochter DeepMind. Es ermöglicht Full-HD-Videos in verschiedenen visuellen Stilen zu erstellen und tritt in Konkurrenz zu kommerziellen Tools wie Runway, Kling oder Kaiber, die auch für Einzelnutzer verfügbar sind.
Laut Google zeichnet sich Veo durch ein hohes Maß an Detailtreue und Konsistenz aus. Personen, Tiere und Objekte sollen sich flüssig und realistisch durch die generierten Szenen bewegen. Als Eingabe akzeptiert Veo nicht nur Text, sondern auch Bilder, was die Konsistenz der generierten Videos drastisch erhöht.
Zeitgleich kündigt Google die Verfügbarkeit von Imagen 3 für alle Vertex AI Kunden in der kommenden Woche an. Das Text-zu-Bild-Modell ermöglicht die Generierung fotorealistischer Bilder aus Textbeschreibungen und bietet Funktionen zur Bildbearbeitung und -anpassung an individuelle Anforderungen.
Um möglichem Missbrauch vorzubeugen, integriert Google Sicherheitsvorkehrungen wie digitale Wasserzeichen, Inhaltsfilter und Governance-Maßnahmen in Veo und Imagen 3. Zudem unterliegen die Modelle den verantwortungsvollen KI-Prinzipien des Unternehmens, heißt es im Blogbeitrag.
Einen früheren Bildgenerator musste Google zwischenzeitlich vom Netz nehmen, als dieser rassistische Vorurteile reproduzierte. Ich kann mir gut vorstellen, dass der Fokus auf Unternehmenskunden bei Veo auch daher rührt, dass Google mehr Kontrolle über die generierten Inhalte behält und eher davon ausgehen kann, dass mit einer so mächtigen Technologie keine Schindluder betrieben werden. OpenAIs Videomodell Sora, das im Frühjahr gezeigt wurde, wartet ebenfalls noch auf seine breite Veröffentlichung.
Erste Pilotkunden wie Smartphone-Hersteller Honor nutzen die Modelle bereits, um Kreativprozesse zu optimieren und Produktionskosten zu senken. Veo eröffnet ihnen zusätzlich den Einstieg in die KI-basierte Videoproduktion. Das sieht dann in der Praxis zum Beispiel so aus:
Der Zugang zu Veo erfolgt zunächst nur auf Anfrage über Google Cloud Account Manager. Imagen 3 wird ab nächster Woche für alle Vertex-AI-Kunden bereitstehen. Mit den neuen generativen KI-Modellen treibt Google die Entwicklung im Bereich maschineller Kreativität weiter voran.