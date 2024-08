Es ist cool, es ist lustig, es ist seltsam, aber was bringt es? Ich habe Gemini Live, Googles konversationsbasierte KI, auf dem Pixel 9 Pro XL getestet. Als Proof of Concept hat mich Gemini Live überzeugt. Es macht Spaß, mit seinem Smartphone zu diskutieren – selbst wenn man dafür mit Gaslighting seitens der KI leben muss. Aber ist diese Funktion wirklich nützlich? Und vor allem: Ist Gemini Live das Abonnement für 21,99 Euro pro Monat wert?

Gemini Nano ist der KI-Assistent von Google für Android-Smartphones. Gemini Live ist ein Modus von Gemini Nano, der es Euch ermöglicht, mit dem Assistenten Gespräche zu führen, anstatt ihm nur Prompts zu schicken. Um Gemini Live zu nutzen, müsst Ihr das Gemini-Advanced-Abonnement für 21,99 Euro pro Monat über Euer Google-Konto bezahlen. Zurzeit könnt Ihr nur auf Englisch mit Gemini sprechen.

Es war echt schwierig für mich, diesen Artikel zu schreiben. Ich wurde gebeten, etwas zu Gemini Live zu machen, weil jeder darüber spricht. Aber ganz ehrlich, es war, als hätte man mich gebeten, einen Aufsatz darüber zu schreiben, wie sich die Taschenlampenfunktion von Smartphones seit 2011 auf das Nutzererlebnis von 18- bis 24-jährigen Franzosen ausgewirkt hat. Es gibt also nicht viel zu sagen.

Natürliche Gespräche

Ein sehr spannender Aspekt von Gemini Live ist der, dass Ihr die KI unterbrechen könnt, wenn sie spricht. Die Idee dahinter ist, auf natürliche Weise über Konzepte, Ideen, Meinungen oder Themen zu diskutieren, zu brainstormen. Gemini Live kann im Gegensatz zu Gemini Nano noch nicht mit anderen Anwendungen oder den Inhalten auf Eurem Bildschirm interagieren.

Es gibt fast keine Verzögerung zwischen dem Zeitpunkt, an dem Ihr Gemini Live eine Frage stellt, und dem Zeitpunkt, an dem die KI Euch antwortet. Die Tatsache, dass Ihr sie unterbrechen könnt, macht die Diskussionen intuitiv. Ihr könnt eine Anfrage leicht korrigieren oder einfach eine Frage vertiefen, selbst wenn Ihr das Thema wechseln müsst, wenn die Antwort nicht zufriedenstellend ist.

Innerhalb einer Sitzung erinnert sich Gemini Live an bestimmte Punkte einer vergangenen Diskussion, wenn man danach fragt. Ihr findet ein schriftliches Protokoll Eurer Sitzungen in der Gemini-Anwendung und die KI versucht immer, Eure Frage/Antwort zu paraphrasieren, wenn sie antwortet. Diese Art der Wiederholung stellt sicher, dass die KI Eure Anfrage richtig verstanden hat.

Gemini Live macht das auf eine ziemlich unauffällige Art und Weise. Aber manchmal hatte ich das Gefühl, dass die KI gerade nur versucht, Zeit zu gewinnen, in der sie eine Antwort improvisieren kann.

Eine manchmal toxische Beziehung

Gemini Live geht ziemlich gut mit Unterbrechungen um. Die KI ist nie beleidigt, obwohl sie manchmal dazu neigt, weiterzusprechen oder sich genau dann zu entschuldigen, wenn Ihr gerade das Wort ergreifen wollt. Das ist ärgerlich. Aber es ist auch sehr unangenehm.

Ich persönlich habe mich für eine weibliche Stimme entschieden. Und zu hören, wie Gemini sich für meine Unhöflichkeit entschuldigt, gibt mir das Gefühl, in einer missbräuchlichen Beziehung zu sein. Ein bisschen so, als wäre Joaquin Phoenix im Film "Her" nicht nur ein Incel, sondern auch ein toxischer Kerl.

Auch die Dynamik der Gespräche kann ein Nachteil sein. Ich musste Gemini oft pausieren, bis ich meine Gedanken geordnet hatte. Denn wenn Ihr zu lange zögert oder eine etwas zu lange Pause macht, sieht Gemini Live darin eine Gelegenheit, Euch zu unterbrechen.

Und manchmal hatte ich das Gefühl, dass die KI mir einfach nur das sagte, was ich ihrer Meinung nach hören wollte. Ich habe sie zum Beispiel gebeten, mir anhand unserer bisherigen Interaktionen zu sagen, was sie über meine Persönlichkeit denkt. Sie überschüttete mich zunächst mit Komplimenten. Ich musste zweimal nachhaken, um Gemini Live dazu zu bringen, mir die Fehler zu nennen, die ich ihrer Meinung nach hatte. Und das sah wirklich sehr nach Gaslighting aus.

All das Gerede, aber wozu?

Insgesamt hat Gemini Live einen ziemlich guten Eindruck bei mir hinterlassen. Als Konzept funktioniert Googles konversationsbasierte KI wie erwartet. Aber wozu dient dieser Dienst?

Im Moment und meiner Meinung nach zu nichts. Ich finde Gemini Nano zum Beispiel viel interessanter. Ich beschreibe es ausführlicher in meinem Test des Pixel 9 Pro XL. Aber Gemini Nano kann mit den auf Eurem Display angezeigten Inhalten interagieren. Ihr könnt Prompts – geschrieben oder gesprochen – kontextbezogen starten, wenn Ihr Euch ein Video auf Youtube anseht oder einen Artikel in Eurem Browser lest. Das ist sehr praktisch. Gemini Nano kann auch Aktionen über mehrere Google-Anwendungen hinweg ausführen.

All das kann Gemini Live im Moment noch nicht. Google verspricht, dass sich das in einigen Wochen oder Monaten ändern wird. Und ich hoffe es, denn das würde Gemini Live eine ganz andere Relevanz verleihen.

Ich fand auch, dass die Antworten von Gemini Live ziemlich generisch und sehr vage waren. Ständig beschlich mich das Gefühl, dass ich die Diskussion steuern musste. Ich habe nicht genug Gegenseitigkeit gespürt und auf Dauer war es ermüdend. Vor allem, wenn ich mehrere Minuten damit verbrachte, mein Anliegen zu präzisieren, indem ich nach und nach mehr Details und Elemente hinzufügte. Ich war immer ziemlich enttäuscht, dass Gemini Live so wenig Mehrwert in unsere Gespräche einbrachte.

Gemini Live spricht sehr natürlich, das ist unbestreitbar. Aber ich finde, dass es der KI trotzdem an Persönlichkeit fehlt. Man kann zwischen zehn verschiedenen Stimmen wählen. Jede Stimme wird von einer Beschreibung begleitet, die den Tonfall und die Klangfarbe angibt. Ich hätte mir gewünscht, dass der Unterschied zwischen einer "ruhigen" und einer "engagierten" Stimme deutlicher hervorgehoben wird.

Und vor allem hätte ich es toll gefunden, wenn der Inhalt oder die Form der Diskussionen ebenfalls je nach gewählter Stimme variiert hätte. Aber abgesehen von der Intonation habe ich keine ausreichend deutlichen Unterschiede festgestellt. Die KI braucht sicher mehr Zeit, um zu trainieren und eine echte Persönlichkeit zu entwickeln. Die Einführung von Variationen in den Antworten, die je nach "Persönlichkeit" der Stimme gegeben werden, könnte sich auch als tendenziös erweisen. Dies ist also kein "objektiver" Mangel von Gemini Live.

Gemini Live im Angesicht des Hypes

Bei meinen Recherchen stieß ich auf das Konzept des "Hype Cycle" oder"Gartner Hype Cycle". Dieses Modell, das von der US-amerikanischen Beratungsfirma Gartner erdacht wurde, besteht aus einer Kurve, die die Entwicklung des Hypes, also des Interesses, an einer neuen Technologie beschreibt.

Diese Entwicklung lässt sich in fünf Phasen unterteilen. Der anfängliche Erfolg bei der Einführung einer Technologie weckt hohe Erwartungen in der Öffentlichkeit. Diese Erwartungen werden unrealistisch und überdimensioniert. Zwangsläufig erfüllt die Technologie diese Erwartungen nicht, die sich damit dann auch nicht erfüllen. Nach diesem Hype beginnt ein Absturz in einen Abgrund der Desillusionierung. Jeder merkt, dass der Hype übertrieben war.

Dann wird man wieder realistischer. Einige Akteure bleiben dabei und bieten neue, rationalere Iterationen der Technologie an. Es geht langsam bergauf, bis schließlich ein Plateau der Produktivität erreicht ist. Die Technologie hat sich eingespielt und erfüllt ihre Funktion, die Nachfrage/Bedürfnisse der Öffentlichkeit.

Gemini Live befindet sich derzeit auf dem Höhepunkt des Hype-Zyklus. Natürlich müssen wir wieder runterkommen und eine gewisse Enttäuschung verkraften, wie ich sie im vorherigen Teil dieses Artikels beschrieben habe.

Aber ich denke auch, dass Google entschlossen zu sein scheint, wieder aufzusteigen, um das berühmte Produktivitätsplateau zu erreichen. Was es mit Gemini Nano anbietet, scheint mir bereits in diese (gute) Richtung zu gehen, und die Konkurrenz von Apple Intelligence wird diese Dynamik des KI-Wettlaufs nur noch verstärken.

An dem Tag, an dem Gemini Live in der Lage ist, Zeit und Ort einer Verabredung aus einer SMS zu erkennen und dann ein Ereignis in meinem Kalender zu erstellen, wird Google mich zu KI-Assistenten bekehrt haben.

Was denkt Ihr über Gemini Live? Habt Ihr Googles Konversations-KI schon getestet?