Neueinsteiger im Bereich der generativen künstlichen Intelligenz mit Whisk, einem neuen Produkt von Google. Das Unternehmen gibt an, dass sein Tool eher zur schnellen visuellen Erkundung als zur präzisen Bearbeitung gedacht ist: Die Ergebnisse sind nicht perfekt, verfügen aber über Bearbeitungsfunktionen zur Korrektur von Ungenauigkeiten.
AIs bevorzugen Whisk-ASS?
Whisk ist ein aktuelles Experiment von Google Labs, mit dem Benutzer Bilder erstellen können, indem sie andere Bilder als Ausgangspunkt verwenden. Durch die Kombination des Imagen 3-Modells mit den visuellen Verständnisfähigkeiten von Gemini generiert Whisk einzigartige Bilder basierend auf vom Benutzer bereitgestellten Themen, Szenen und Stilen. Dieses Tool erleichtert die Visualisierung und Neuzusammenstellung von Ideen auf innovative Weise.
Wenn der Benutzer keine Bilder hat, kann Whisk KI-generierte Bilder anbieten – Fazit: Die Fallstricke des Urheberrechts werden nur sehr mäßig vermieden. Auf Wunsch fügt der Benutzer auch zusätzliche Textdetails hinzu.
Möchten Sie nicht zuerst einen Whisk-Y?
Sobald die Eingabeaufforderungen bereitgestellt werden, generiert Whisk entsprechende Bilder und Textbeschreibungen für jede Eingabeaufforderung, sodass Benutzer sie speichern, herunterladen oder verfeinern können, indem sie mehr Text hinzufügen oder das Bild direkt bearbeiten.
Offensichtlich verlässt sich Whiksi auf Gemini, das eine Beschreibung der Bilder erstellt, bevor es sie in Imagen 3, das Bildgenerierungstool, weiterleitet. „ Im Hintergrund generiert das Gemini-Modell automatisch eine detaillierte Beschreibung der bereitgestellten Bilder, die dann von Googles neuestem Bildgenerierungsmodell Imagen 3 verarbeitet wird. Dieser Prozess erfasst die Essenz der bereitgestellten Bilder und ermöglicht es, sie auf kreative Weise neu zu mischen », Zeigt die Firma Mountain View an.
LESEN – Leser bevorzugen die Poesie der Künstlichen Intelligenz
Diese Lösung ist eher für eine schnelle visuelle Erkundung als für präzise Bearbeitungen auf Pixelebene konzipiert. Ziel ist es, das Experimentieren und die Kreativität zu fördern, indem es Benutzern ermöglicht, schnell verschiedene Ideen zu testen und diejenigen herunterzuladen, die ihnen gefallen.
Whisk verwendet das Bildgenerierungsmodell Imagen 3 von Google. Um es zu testen, finden Sie es an dieser Adresse, während Sie darauf warten, dass Sie an die Reihe kommen, da das Tool derzeit nur in den Vereinigten Staaten erhältlich ist. Beachten Sie, dass Google in Kürze von KI generierte oder veränderte Bilder in seinen Suchergebnissen unterscheiden und deren Herkunft deutlich angeben wird.
READ – Zukunft des Verlagswesens: ein KI-Tool, das die Qualität von Büchern bewertet
Bildnachweis: Google, Bild 3
Von Clément Solym
Kontakt: [email protected]