Google hatte noch im vergangenen Jahr etwas verzögert das letzte für 2023 vierteljährliche Pixel Feature Drop verteilt. Der Fokus liegt dabei besonders auf dem Google Pixel 8 Pro, das mit der Video-Boost-Funktion beispielsweise einen verbesserten Videomodus bekommen hat. Die KI sorgt dabei für eine bessere Bildstabilisierung, weniger Rauschen und eine optimierte Beleuchtung.

Erster Einsatz der Gemini Nano KI auf Eurem Google Pixel 8 Pro

Auch heute widmen wir uns einer Funktion, die ausschließlich auf dem Google Pixel 8 Pro verfügbar ist – auf die hauseigene KI Gemini Nano setzt. Das kleinste von Googles LLM-Modellen läuft auch offline – also ohne Internetverbindung. So erstellt Euch die künstliche Intelligenz eine Zusammenfassung von Sprachaufnahmen in Schriftform. Warum das ab sofort auch ohne Internetzugang funktioniert, erwähne ich noch einmal ganz am Ende des Beitrages. Nur soviel: Das Zauberwort heißt Android AICore.

Systemsprache English (US) einstellen

Das Ganze hat aktuell leider noch einen Haken: Das Feature ist ausschließlich in englischer (US) Sprache verfügbar. Google wird hier nach und nach weitere Sprachpakete ausliefern. Wenn Ihr also Gemini Nano einmal auf Eurem Google Pixel 8 Pro testen wollt, dann stellt Eure Systemsprache einfach auf English (US):

  • Geht dazu in die Einstellungen
  • Geht dann auf System
  • Dann Sprachen und Systemsprachen
Screenshot der Google Rekorder App wie mithilfe der Gemini Nano KI eine Zusammenfassung erstellt wird.
Zuerst einmal die Sprache auf English (US) umstellen. / © nextpit Bildquelle: nextpit
  • Jetzt müsst Ihr (wenn nicht schon getan) das englische (US) Sprachpaket herunterladen
  • Nun muss die Sprache nur noch an Position Eins verschoben werden (an den zwei Strichen packen)
  • Jetzt seid Ihr bereit für Googles KI Gemini Nano
Screenshot der Google Rekorder App wie mithilfe der Gemini Nano KI eine Zusammenfassung erstellt wird.
Aktuell läuft Gemini Nano nur in der englischen Sprache./ © nextpit Bildquelle: nextpit

Die Google Rekorder-App

Bereits vor einem Jahr hatte Google ein Pixel Feature Drop verteilt, was der Rekorder-App die Fähigkeit verlieh, Audioaufnahmen zu transkribieren. Auch konnte die KI damals bereits mehrere Sprecher unterscheiden und die Aufnahme entsprechend als Dialog anlegen. Google fragt Euch bei der ersten Verwendung des Rekorders, ob Ihr die Sprecher-Erkennung aktivieren wollt.

Tatsächlich hat sie in meinem kleinen Test mit dem Kollegen Rubens nicht zu 100 Prozent funktioniert, da zum einen drei Sprecher erkannt wurden und zum anderen der letzte Satz “ Yes, now we check it“ wieder von mir (Speaker 1 & 2) kam. Zugegeben: Wir sind beide keine englischen Muttersprachler.

Screenshot der Google Rekorder App wie mithilfe der Gemini Nano KI eine Zusammenfassung erstellt wird.
So ganz funktioniert die Personenerkennung noch nicht. / © nextpit Bildquelle: nextpit

Erste Sprachaufnahme und Zusammenfassung

Um eine Zusammenfassung der in Text gewandelten Sprachaufzeichnung zu erhalten, sollte der Text nicht zu kurz sein. In meinem ersten Beispiel (first recording) ist der Text beispielsweise zu kurz.

Screenshot der Google Rekorder App wie mithilfe der Gemini Nano KI eine Zusammenfassung erstellt wird.
Diese Sprachaufzeichnung war wohl für die KI zu kurz. / © nextpit Bildquelle: nextpit

Danach habe ich einige Absätze meines Tests des Amazon Echo Show 5 (2023) abgelesen. Nun wollte das Smartphone auch das Large Language Model (LLM) der Gemini Nano KI herunterladen, welches für die Zusammenfassung benötigt wird.

Screenshot der Google Rekorder App wie mithilfe der Gemini Nano KI eine Zusammenfassung erstellt wird.
Ist die Audio-Aufzeichnung – und entsprechend auch das Transcript – dann erstellt Euch Gemini Nano drei Stichpunkte mit einer Zusammenfassung Eurer Datei. © nextpit Bildquelle: nextpit

Jetzt kurz gewartet, und schon beginnt die künstliche Intelligenz die Zusammenfassung unseres Transcripts zu erstellen.

Das LLM Gemini Nano arbeitet auf einem AICore

Gemini ist die neueste und effektivste künstliche Intelligenz von Google. Im Grunde gibt es drei Variationen:

  • Gemini Ultra – Googles größtes und leistungsstärkstes Modell für hochkomplexe Aufgaben
  • Gemini Pro – Googles bestes Modell für die Skalierung für ein breites Aufgabenspektrum und
  • Gemini Nano – das effizienteste Modell aus Mountain View, für Aufgaben auf dem Gerät
Android AICore
Der Android AICore verwaltet Modell-, Laufzeit- und Sicherheitsfunktionen. / © Google Bildquelle: Google

Bei Gemini Nano kommt ein Systemdienst mit dem Namen Android AICore zum Einsatz. Er arbeitet unabhängig vom restlichen System und benötigt keinen Zugriff auf Euer Netzwerk. Das ist besonders vorteilhaft, wenn Ihr Aufgaben erledigt, welche beispielsweise wie WhatsApp eine Ende-zu-Ende-Verschlüsselung benötigen und der Datenschutz effektiv gewährleistet sein soll. 

Vorschläge und Antworten von Gemini Nano verlassen also nicht Euer Smartphone und sind somit geschützt. Das war auch für „Smart Reply“ im Gboard besonders wichtig. In der Developer Preview liefert hier das Pixel 8 Pro bei den Messenger-Apps Line, KakaoTalk und WhatsApp mit Hilfe von Gemini Nano qualitativ hochwertige Antwortvorschläge mit Gesprächsbewusstsein.

Und? Wer von Euch greift schon regelmäßig auf künstliche Intelligenz zurück? Welche nutzt Ihr und wofür? Schreibt uns Eure Erfahrungen gern unten in die Kommentare.

Mit diesem Symbol kennzeichnen wir Partner-Links. Wenn du so einen Link oder Button anklickst oder darüber einkaufst, erhalten wir eine kleine Vergütung vom jeweiligen Website-Betreiber. Auf den Preis eines Kaufs hat das keine Auswirkung. Du hilfst uns aber, nextpit weiterhin kostenlos anbieten zu können. Vielen Dank!