Google baut KI-Strategie aus: Gemini 1.5 Pro, Videogenerierung und KI-Prozessor

Auf der hauseigenen Cloud-Konferenz hat Google umfangreiche Ankündigungen zum KI-Ausbau gemacht. Neu sind ein eigener Prozessor und ein Tool zur Videoerzeugung.

In Pocket speichern vorlesen Druckansicht
Google-Schriftzug an weißer Wand

(Bild: testing/Shutterstock.com)

Lesezeit: 4 Min.
Inhaltsverzeichnis

Google kündigt zum Auftakt seiner "Cloud Next"-Konferenz 2024 am Dienstag eine Reihe Neuerungen an, die insbesondere die allgegenwärtige KI in den hauseigenen Cloud-Diensten betreffen. Dabei gibt es eine neue Version von Googles Sprachmodell und -assistenten Gemini 1.5 Pro sowie einen von Google selbst entwickelten ARM-Prozessor: Axion. Mit Vids bringt Google ferner ein kostenpflichtiges Tool zur Generierung von Videos mit Sprachbefehlen auf den Markt.

Gemini 1.5 Pro kann nun verschiedene Arten von Audio erstellen, etwa Musik, Sprache und Tonspuren für Videos. Diese lassen sich mit einfachen Sprachbefehlen (Prompts) erzeugen. Bilder nutzt Gemini nur als Datenquelle (Image to Text), kann diese aber nicht erzeugen. Dafür verweist Google auf den Assistenten Imagen 2, der nun auch animierte Grafiken erstellt. Googles KI-Plattform Vertex beinhaltet neben Gemini und Imagen über 130 Modelle für verschiedene Einsatzzwecke. Das Grounding der Modelle (Nachschärfen mit individuellen Daten) können Anwenderinnen und Anwender nun mit Google Suche oder den eigenen Firmendaten durchführen. Mit dem neuen Agent Builder der Vertex-Plattform lassen sich komplette, intelligente Agenten für Kunden gestalten und auf der Plattform betreiben.

Angekündigt hat Google ferner neue Hardware für die Cloud-Systeme, zumeist auch in Hinblick auf KI-Unterstützung: Die Firma wird künftig die TPU v5p von Tensor einsetzen und Nvidias A3 Mega (H100) beziehungsweise Blackwell-GPU-Plattform. Hinzu kommt ein optimierter Speicher, der laut Google 12-mal schnellere Ladezeiten für KI-Modelle und 3,9-mal schnellere Trainingszeiten bietet.

Die neue Google-eigene CPU Axion auf ARM-Basis (Neoverse V2) soll 50 Prozent performanter und 60 Prozent energieeffizienter als vergleichbare x86-Plattformen sein. Und sie soll eine 30 Prozent bessere Performance bieten als vergleichbare heutige ARM-Instanzen in der Cloud.

Auch die Ankündigungen für Developer haben Künstliche Intelligenz im Gepäck: Gemini Code Assist arbeitet mit Gemini 1.5 Pro kontextbezogen und funktioniert mit GitLab, GitHub, BitBucket oder on premises. Dabei lassen sich sowohl die eigene Firmen-Code-Basis integrieren als auch Tools wie Apigee, Stack Overflow, Terraform, Datadog, Redis, Neo4j und weitere. Das Tool Cloud Assist dient dem Ressourcenmanagement.

Der Google-Assistent hilft auch beim Datenmanagement, zum Beispiel mit Big Query bei Abfragen und Analysen in natürlicher Sprache. Das beinhaltet auch das Verwalten von Vektordatenbanken und der Vertex-Plattform selbst. Data Canvas schließlich verspricht laut Google Notebook-ähnliche Darstellungen von Daten. In der Infrastruktur gibt es ein verbessertes Loadbalancing für KI-Anwendungen.

Die Konferenz zu Machine Learning und KI von Heise
Minds Mastering Machines

Am 24. und 25. April 2024 findet in Köln die Minds Mastering Machines statt. Die von iX und dpunkt.verlag ausgerichtete Fachkonferenz jenseits des KI-Hypes richtet sich an Data Scientists, Data Engineers und Developer, die Machine-Learning-Projekte in die Realität umsetzen.

Das Programm der Konferenz bietet an zwei Tagen gut 30 Vorträge in drei Tracks. Am zweiten Konferenztag wird es zudem eine Panel-Diskussion zu den Auswirkungen des AI Act geben.

Im virtuellen Büro von Google wird es mit Vids ein neues Tool zur Videoerzeugung mit Sprachbefehlen (Prompts) geben. Hinzu kommt ein Studio für die Nachbearbeitung mit Bildern, Szenen und Ton. Die Produzentinnen und Produzenten haben dabei Zugriff auf Millionen Szenen, Bilder und Audio-Clips aus einem Stock-Pool.

Der gesamte Workspace wird KI-unterstützt und verknüpft die verschiedenen Elemente intelligent, wobei sich auch der firmeneigene Daten-Pool einlesen lässt. So kann die Umgebung etwa das Corporate Design einer Firma erkennen und darauf basierend Gestaltungen vornehmen.

Kleinere Neuerungen betreffen Tabs für Google Docs oder die Integration von Teams und Slack in den Chat. Hinzu kommt ein Sicherheitspaket, das – KI-gestützt – auch Google Drive mitschützt. Ferner soll es Spam in Gmail um 20 Prozent besser erkennen und Post-Quantenalgorithmen beherrschen.

Sowohl Vids als auch das Sicherheitspaket werden kostenpflichtige Add-ons sein.

(who)