Künstliche Intelligenz: Google trickst bei Gemini-Vorstellung und erntet Kritik

In dem auf den ersten Blick beeindruckenden Video zur Vorstellung von Gemini hat Google getrickst. Google erwähnt das nur unter dem Video und erntet Kritik.

In Pocket speichern vorlesen Druckansicht 26 Kommentare lesen
A,Person's,Head,Covered,By,An,Ai-labeled,Dark,Cloud

(Bild: photoschmidt/ Shutterstock.com)

Lesezeit: 3 Min.

In dem durchaus beeindrucken Video zur Vorstellung von Googles nächster KI Gemini, hat Google getrickst. Neben der Nutzung von Standbildern aus dem Filmmaterial wurde das Produktvideo auch mit Eingabeaufforderungen per Text erstellt. Das ist im Video nicht ersichtlich und Google hatte darauf nur dezent hingewiesen – in der Videobeschreibung, aber nicht in dem Video selbst. Gegenüber Bloomberg bestätigte Google die Bearbeitung des Videos.

Mit den Videos zur Vorstellung von Gemini beeindruckte Google durchaus. Die KI Gemini interpretierte, während in einer einfachen Skizze schrittweise eine Ente entstand, was sie abgebildet sah – ähnlich einem Menschen. Auch das Hütchenspiel – unter welchem Becher liegt der Gegenstand – beherrschte die Künstliche Intelligenz. Zwar erklärt Google selbst unter dem Video auf YouTube: "Für diese Demo wurde die Latenzzeit verringert und die Gemini-Ausgaben wurden gekürzt", der Hinweis fehlt jedoch in dem Video selbst.

Die medienweite Kritik erfolgt aber nicht nur, weil in dem Video nicht darauf hingewiesen wird, sondern auch, weil die Demo "mithilfe von Standbildern aus den Aufnahmen und per Text-Eingabeaufforderung erstellt" wurden. Das bestätigte ein Google-Sprecher gegenüber Bloomberg. Google erklärt auf seiner Website, wie Gemini etwa auf das dargestellte "Stein, Schere, Papier" gekommen ist. Dabei wird zuerst jeweils eine Hand für die jeweiligen Gegenstände des Spiels gezeigt und anschließend alle drei Bilder nebeneinander. Zusätzlich zu den drei Bildern wird Gemini per Text darauf hingewiesen, dass es sich dabei um ein Spiel handle.

Die hier enthaltenen Hinweise und Aufforderung fehlen in den Videos. Das sorgt für Kritik.

(Bild: Google)

Wenn die in den Videos von Gemini erkannten Vorgänge ähnlich vorbereitet wurden, sei das etwas ganz anderes, als Google suggeriere, schreibt Bloomberg. Auch habe die Audio-Ausgabe von Gemini von Menschen eingegebene Aufforderungen wiedergegeben. Einen ersten Hinweis darauf gab der Wharton-Professor für KI Ethan Mollick auf X (Twitter) in einem Post, dass das Video zwar ziemlich cool sei, er aber kaum glauben könne, dass hier hinter den Kulissen keine Eingaben stattgefunden hätten. "KIs der GPT-4-Klasse sind gut darin, Absichten zu interpretieren, aber nicht so stark, wenn sich der Kontext ändert."

Bloomberg vermutet hinter Demo die größte der drei Gemini-Versionen – Gemini Ultra –, die bislang noch gar nicht auf dem Markt ist. Das Verschweigen der oben genannten Details interpretiert das Medienunternehmen als Marketingbemühungen. Die Gemini-Version, die zukünftig hinter Bard werkeln soll, ist Gemini Pro, die bislang nur auf Englisch in 170 Ländern verfügbar ist. Deutschland und die EU zählen bisher nicht dazu, sollen aber "in naher Zukunft folgen". Google will die Ultra-Version seiner KI im kommenden Jahr veröffentlichen.

(bme)