Google hat die Bilderzeugungsfunktionen von Gemini aktiv verbessert. Nach der Einführung von AI Studio, das native KI-Bearbeitung im Web bietet, erweitert Google nun einige dieser Funktionen auf die Gemini-App für Mobilgeräte. Diese erweiterte Funktion ermöglicht es den Nutzern, Bilder in den Chatbot hochzuladen und mit natürlichsprachlichen Anweisungen zu bearbeiten.

Das KI-Studio von Google, das über die Gemini-Weboberfläche zugänglich ist, nutzt das Gemini-2.0-Flash-Modell. Sein Vorteil liegt in der Fähigkeit, Bilder mit kontextbezogenen und komplexen Textaufforderungen zu erstellen und zu bearbeiten, ohne dass herkömmliche Bearbeitungstools oder spezielle Kenntnisse erforderlich sind. Jetzt führt Google eine ähnliche Bildbearbeitungsfunktion für die Gemini-Mobile-App ein.

Bearbeitet Bilder direkt in der Gemini-App

Mit diesem Update können die Nutzer/innen sowohl KI-generierte Kreationen als auch ihre Originalbilder direkt in die Gemini-App hochladen und die Bearbeitungen einfach mit Hilfe von Textanweisungen durchführen. Die Anzahl der Bearbeitungen, die ein Nutzer auf ein Bild anwenden kann, ist nicht begrenzt. Google betont, dass das Tool am besten für Aufgaben wie das Ändern von Hintergründen und Stilen sowie das Hinzufügen, Entfernen oder Optimieren bestimmter Elemente in einem Bild geeignet ist.

Die Gemini-App bietet eine native Bildbearbeitung mit Textanweisungen. Die Nutzer können einfache bis lange Textanweisungen verwenden. / © Google

Die In-App-Bildbearbeitung ist auf eine mehrstufige Bearbeitung ausgelegt, so dass die Nutzer/innen ihre Bearbeitungen iterativ verfeinern können. Ihr könnt mit anfänglichen Sprüchen beginnen und sie weiter ausbauen und sogar visuelle Erzählungen wie Geschichtenbücher erstellen. Außerdem wirbt Google damit, dass die Textanweisungen "intuitivere und kontextbezogenere" Ergebnisse liefern werden. Die bearbeiteten Bilder werden außerdem mit dem SynthID-Wasserzeichen versehen, ähnlich wie die von Gemini generierten Standardbilder.

Im Gegensatz zu AI Studio, das derzeit auf das Gemini 2.0 Flash-Modell beschränkt ist, können Nutzer/innen bei der neuen In-App-Bildbearbeitung jedes verfügbare Gemini-Modell auswählen. Folglich werden Nutzer/innen der Android-Version kostenlosen Zugang zu dieser Funktion haben, sobald sie eingeführt wird. Damit hat Gemini einen potenziellen Vorteil gegenüber anderen Chatbots und KI-Plattformen wie ChatGPT von OpenAI.

Die Funktion wird derzeit ausgerollt und Google geht davon aus, dass sie in den kommenden Wochen in den meisten Ländern und 45 Sprachen verfügbar sein wird.