Google erweitert Gemini aktuell sehr schnell um weitere Funktionen. Eine davon ist Gemini Live with Video, eine von Project Astra unterstützte Funktion. Diese Funktion, die jetzt für ausgewählte Nutzer eingeführt wird, ermöglicht es Gemini, den Bildschirm des Geräts in Echtzeit zu analysieren und in natürlicher Sprache zu antworten.

Das im vergangenen Jahr angekündigte Project Astra ist Googles Initiative zur Entwicklung von KI-Chatbots, die über den Bildschirm oder die Kamera eines Smartphones in Echtzeit interagieren können. Google bestätigte die Pläne zur Einführung von Gemini Live with Video im letzten Monat und jetzt berichten erste Nutzer, dass die Funktion auf ihren Geräten verfügbar ist.

Geminis "Screen Share mit Live" Funktion

Ein Reddit-Nutzer mit einem Xiaomi-Gerät teilte kürzlich mit, dass er jetzt Zugang zu "Screen Share with Gemini" hat. Damit kann Gemini Live das, was auf Eurem Bildschirm zu sehen ist, in Echtzeit anzeigen, anstatt ein statisches Bild oder einen aufgezeichneten Clip zu analysieren. Die Nutzer können Gemini Live Fragen zu dem, was angezeigt wird, stellen und sich sogar an Diskussionen über den Inhalt beteiligen.

Das funktioniert Berichten zufolge in den meisten Apps, einschließlich der Galerie und dem Webbrowser. Als der Nutzer Gemini Live jedoch bat, YouTube zu öffnen, antwortete die KI, dass sie auf Chats und Zusammenarbeit beschränkt ist. Dieses Tool kann über die neue Schaltfläche "Screen Share with Gemini" erreicht werden, die sich über der Schaltfläche "Ask About Screen" im Gemini Floating Sheet befindet.

So greift Gemini Live auf den Kamera-Feed zu

Eine weitere Funktion, die zusammen mit "Screen Share with Gemini" eingeführt wird, ist "Gemini Live with Video", mit der Nutzer Live-Kameraansichten an Gemini senden können. Anders als bei der Bildschirmfreigabe kann Gemini mit dieser Funktion den Live-Kamera-Feed analysieren, egal ob er von der Rück- oder Frontkamera stammt. Sobald die Funktion verfügbar ist, kann sie über die Gemini-App aufgerufen werden, indem du Gemini Live startest und auf den neuen Video-Button tippst, der auch eine Pausenfunktion unterstützt, ähnlich wie bei der reinen Sprachfunktion von Gemini Live.

Anders als Google Lens oder das "Ask About Screen"-Tool ermöglicht Gemini Live with Video eine natürlichere, sprachbasierte Konversation, anstatt sich auf ein webbasiertes Suchlayout zu verlassen. Das macht die Interaktion flüssiger und intuitiver.

Aufregend oder besorgniserregend?

Ein wichtiger Aspekt der Gemini Live-Funktionen ist die Frage, wie Google die Daten und Medien, die über die Funktion geteilt werden, nutzen kann. Wie bei anderen multimodalen Gemini-Tools können Eingaben wie Sprache, Bilder oder andere Interaktionen genutzt werden, um die KI-Modelle von Google weiter zu trainieren und zu verfeinern.

Das Spannende daran ist, dass Gemini im Laufe der Zeit deutlich reaktionsschneller, intelligenter und personalisierter werden könnte. Indem das System aus der realen Nutzung lernt, kann es sich an die Vorlieben und Bedürfnisse der Nutzer anpassen und letztlich intuitivere Hilfe anbieten. Diese Art der kontinuierlichen Verbesserung ist das Herzstück der modernen KI.

Allerdings wirft dies auch wichtige Fragen zum Datenschutz und zur Datenkontrolle auf. Auch wenn Google verspricht, die gleichen Datenschutz- und Sicherheitsstandards wie bei seinen anderen Diensten einzuhalten, werden sich die Nutzer fragen, wie genau ihre Daten verwendet werden, wer auf sie zugreifen kann und wie lange sie gespeichert werden. Transparenz wird der Schlüssel sein. Die Nutzer sollten klare und verständliche Erklärungen über den Umgang mit ihren Daten erwarten und einfordern.

Wir gehen davon aus, dass Google im Laufe der Einführung von Gemini Live detailliertere Informationen zur Verfügung stellen wird, insbesondere zu den Nutzerkontrollen, Opt-in-Mechanismen und Datenschutzgarantien. Bis dahin sollten die Nutzer den Nervenkitzel der intelligenten KI mit einer gesunden Portion Vorsicht genießen.

Im Moment scheinen die Gemini Live Funktionen nur für eine sehr begrenzte Anzahl von Nutzern verfügbar zu sein. Ich habe auf meinem Samsung Galaxy-Gerät nachgesehen und festgestellt, dass die Funktion noch nicht aktiviert worden ist. Außerdem ist für den Zugriff auf diese Tools ein Google One AI Premium-Abonnement erforderlich.

Habt ihr schon eines der KI-Tools von Gemini getestet? Welche Funktionen findet ihr am nützlichsten? Teilt eure Meinung in den Kommentaren!