Google hatte noch im vergangenen Jahr etwas verzögert das letzte für 2023 vierteljährliche Pixel Feature Drop verteilt. Der Fokus liegt dabei besonders auf dem Google Pixel 8 Pro, das mit der Video-Boost-Funktion beispielsweise einen verbesserten Videomodus bekommen hat. Die KI sorgt dabei für eine bessere Bildstabilisierung, weniger Rauschen und eine optimierte Beleuchtung.

Erster Einsatz der Gemini Nano KI auf Eurem Google Pixel 8 Pro

Auch heute widmen wir uns einer Funktion, die ausschließlich auf dem Google Pixel 8 Pro verfügbar ist – auf die hauseigene KI Gemini Nano setzt. Das kleinste von Googles LLM-Modellen läuft auch offline – also ohne Internetverbindung. So erstellt Euch die künstliche Intelligenz eine Zusammenfassung von Sprachaufnahmen in Schriftform. Warum das ab sofort auch ohne Internetzugang funktioniert, erwähne ich noch einmal ganz am Ende des Beitrages. Nur soviel: Das Zauberwort heißt Android AICore.

Systemsprache English (US) einstellen

Das Ganze hat aktuell leider noch einen Haken: Das Feature ist ausschließlich in englischer (US) Sprache verfügbar. Google wird hier nach und nach weitere Sprachpakete ausliefern. Wenn Ihr also Gemini Nano einmal auf Eurem Google Pixel 8 Pro testen wollt, dann stellt Eure Systemsprache einfach auf English (US):

Geht dazu in die Einstellungen

Geht dann auf System

Dann Sprachen und Systemsprachen

Zuerst einmal die Sprache auf English (US) umstellen. / © nextpit

Jetzt müsst Ihr (wenn nicht schon getan) das englische (US) Sprachpaket herunterladen

herunterladen Nun muss die Sprache nur noch an Position Eins verschoben werden (an den zwei Strichen packen)

Jetzt seid Ihr bereit für Googles KI Gemini Nano

Aktuell läuft Gemini Nano nur in der englischen Sprache./ © nextpit

Die Google Rekorder-App

Bereits vor einem Jahr hatte Google ein Pixel Feature Drop verteilt, was der Rekorder-App die Fähigkeit verlieh, Audioaufnahmen zu transkribieren. Auch konnte die KI damals bereits mehrere Sprecher unterscheiden und die Aufnahme entsprechend als Dialog anlegen. Google fragt Euch bei der ersten Verwendung des Rekorders, ob Ihr die Sprecher-Erkennung aktivieren wollt.

Tatsächlich hat sie in meinem kleinen Test mit dem Kollegen Rubens nicht zu 100 Prozent funktioniert, da zum einen drei Sprecher erkannt wurden und zum anderen der letzte Satz " Yes, now we check it" wieder von mir (Speaker 1 & 2) kam. Zugegeben: Wir sind beide keine englischen Muttersprachler.

So ganz funktioniert die Personenerkennung noch nicht. / © nextpit

Erste Sprachaufnahme und Zusammenfassung

Um eine Zusammenfassung der in Text gewandelten Sprachaufzeichnung zu erhalten, sollte der Text nicht zu kurz sein. In meinem ersten Beispiel (first recording) ist der Text beispielsweise zu kurz.

Diese Sprachaufzeichnung war wohl für die KI zu kurz. / © nextpit

Danach habe ich einige Absätze meines Tests des Amazon Echo Show 5 (2023) abgelesen. Nun wollte das Smartphone auch das Large Language Model (LLM) der Gemini Nano KI herunterladen, welches für die Zusammenfassung benötigt wird.

Ist die Audio-Aufzeichnung – und entsprechend auch das Transcript – dann erstellt Euch Gemini Nano drei Stichpunkte mit einer Zusammenfassung Eurer Datei. © nextpit

Jetzt kurz gewartet, und schon beginnt die künstliche Intelligenz die Zusammenfassung unseres Transcripts zu erstellen.

Noch einen weiteren Google-Pixel-Tipp gefällig? So könnt Ihr Euer Pixel-Phone in eine Webcam verwandeln

Das LLM Gemini Nano arbeitet auf einem AICore

Gemini ist die neueste und effektivste künstliche Intelligenz von Google. Im Grunde gibt es drei Variationen:

Gemini Ultra – Googles größtes und leistungsstärkstes Modell für hochkomplexe Aufgaben

Gemini Pro – Googles bestes Modell für die Skalierung für ein breites Aufgabenspektrum und

Gemini Nano – das effizienteste Modell aus Mountain View, für Aufgaben auf dem Gerät

Der Android AICore verwaltet Modell-, Laufzeit- und Sicherheitsfunktionen. / © Google

Bei Gemini Nano kommt ein Systemdienst mit dem Namen Android AICore zum Einsatz. Er arbeitet unabhängig vom restlichen System und benötigt keinen Zugriff auf Euer Netzwerk. Das ist besonders vorteilhaft, wenn Ihr Aufgaben erledigt, welche beispielsweise wie WhatsApp eine Ende-zu-Ende-Verschlüsselung benötigen und der Datenschutz effektiv gewährleistet sein soll.

Vorschläge und Antworten von Gemini Nano verlassen also nicht Euer Smartphone und sind somit geschützt. Das war auch für "Smart Reply" im Gboard besonders wichtig. In der Developer Preview liefert hier das Pixel 8 Pro bei den Messenger-Apps Line, KakaoTalk und WhatsApp mit Hilfe von Gemini Nano qualitativ hochwertige Antwortvorschläge mit Gesprächsbewusstsein.

Affiliate Angebot Google Pixel 8 Pro

Und? Wer von Euch greift schon regelmäßig auf künstliche Intelligenz zurück? Welche nutzt Ihr und wofür? Schreibt uns Eure Erfahrungen gern unten in die Kommentare.