KI-Magie: Gemini bearbeitet Fotos mit Euren Wörtern!

02.05.2025, 15:00

Gemini Image Generation on a Galaxy A36 smartphone — © nextpit

Jade Bryan

In anderen Sprachen lesen:

Português / English

Google hat die Bilderzeugungsfunktionen von Gemini aktiv verbessert. Nach der Einführung von AI Studio, das native KI-Bearbeitung im Web bietet, erweitert Google nun einige dieser Funktionen auf die Gemini-App für Mobilgeräte. Diese erweiterte Funktion ermöglicht es den Nutzern, Bilder in den Chatbot hochzuladen und mit natürlichsprachlichen Anweisungen zu bearbeiten.

Das KI-Studio von Google, das über die Gemini-Weboberfläche zugänglich ist, nutzt das Gemini-2.0-Flash-Modell. Sein Vorteil liegt in der Fähigkeit, Bilder mit kontextbezogenen und komplexen Textaufforderungen zu erstellen und zu bearbeiten, ohne dass herkömmliche Bearbeitungstools oder spezielle Kenntnisse erforderlich sind. Jetzt führt Google eine ähnliche Bildbearbeitungsfunktion für die Gemini-Mobile-App ein.

Bearbeitet Bilder direkt in der Gemini-App

Mit diesem Update können die Nutzer/innen sowohl KI-generierte Kreationen als auch ihre Originalbilder direkt in die Gemini-App hochladen und die Bearbeitungen einfach mit Hilfe von Textanweisungen durchführen. Die Anzahl der Bearbeitungen, die ein Nutzer auf ein Bild anwenden kann, ist nicht begrenzt. Google betont, dass das Tool am besten für Aufgaben wie das Ändern von Hintergründen und Stilen sowie das Hinzufügen, Entfernen oder Optimieren bestimmter Elemente in einem Bild geeignet ist.

Ein Dalmatinerhund mit gelber Mütze, der auf Gras und am Strand in zwei verschiedenen Bildern sitzt. — Die Gemini-App bietet eine native Bildbearbeitung mit Textanweisungen. Die Nutzer können einfache bis lange Textanweisungen verwenden. / © Google

Die In-App-Bildbearbeitung ist auf eine mehrstufige Bearbeitung ausgelegt, so dass die Nutzer/innen ihre Bearbeitungen iterativ verfeinern können. Ihr könnt mit anfänglichen Sprüchen beginnen und sie weiter ausbauen und sogar visuelle Erzählungen wie Geschichtenbücher erstellen. Außerdem wirbt Google damit, dass die Textanweisungen "intuitivere und kontextbezogenere" Ergebnisse liefern werden. Die bearbeiteten Bilder werden außerdem mit dem SynthID-Wasserzeichen versehen, ähnlich wie die von Gemini generierten Standardbilder.

Im Gegensatz zu AI Studio, das derzeit auf das Gemini 2.0 Flash-Modell beschränkt ist, können Nutzer/innen bei der neuen In-App-Bildbearbeitung jedes verfügbare Gemini-Modell auswählen. Folglich werden Nutzer/innen der Android-Version kostenlosen Zugang zu dieser Funktion haben, sobald sie eingeführt wird. Damit hat Gemini einen potenziellen Vorteil gegenüber anderen Chatbots und KI-Plattformen wie ChatGPT von OpenAI.

Die Funktion wird derzeit ausgerollt und Google geht davon aus, dass sie in den kommenden Wochen in den meisten Ländern und 45 Sprachen verfügbar sein wird.

Quelle: Google

Die besten Klapp-Smartphones im Test und Vergleich

	Bestes Klapp-Smartphone	Beste Android-Alternative	Bestes Clamshell-Smartphone	Beste Foldable-Alternative	Beste Clamshell-Alternative	Preis-Tipp	Das dünnste Klapp-Smartphone
Produkt	OnePlus Open	Samsung Galaxy Z Fold 5	Samsung Galaxy Z Flip 5	Google Pixel Fold	Motorola Razr 40 Ultra	Motorola Razr 40	Honor Magic V2
Bild
Test	Test: OnePlus Open	Test: Samsung Galaxy Z Fold 5	Test: Samsung Galaxy Z Flip 5	Test: Google Pixel Fold	Test: Motorola Razr 40 Ultra	Test: Motorola Razr 40	Test: Honor Magic V2
Preis (UVP)	1.799 €	ab 1.899 €	ab 1.199 €	ab 1.899 €	1.199 €	899,99 €	1.999 €
Angebote	Zum Shop 1.799,00 € (OnePlus) * Zum Shop 1.716,00 € (Gomibo) *	Zum Shop 1.799,00 € (Samsung) *	Zum Shop 1.049,00 € (Samsung) *	Zum Shop 1.899,00 € (Google) * Zum Shop 1.699,00 € (Media Markt) *	Zum Shop 747,00 € (Gomibo) * Zum Shop 788,79 € (Jacob) *	Zum Shop 632,00 € (Gomibo) *	Zum Shop 1.999,00 € (Media Markt) * Zum Shop 1.999,00 € (Alza) *