Ankündigungen zum Thema KI häufen sich. Nach OpenAI, das seinen Adventskalender nutzte, um Sora vorzustellen, ist nun Google an der Reihe, in die Tiefen der Bildgenerierung vorzudringen. Google Labs, der Zweig, der sich dem Testen und Experimentieren mit den neuesten Technologien des Unternehmens widmet, wurde diese Woche eröffnet Schneebesen, ein Werkzeug der neuen Generationdas in der Lage ist, Bilder nicht wie üblich aus Textaufforderungen, sondern aus anderen Bildern zu generieren. In einem offiziellen Blogbeitrag erklärt das Unternehmen: „Anstatt Bilder mit langem, detailliertem Text zu erstellen, können Sie mit Whisk Eingabeaufforderungen mit Bildern erstellen„.
Abonnieren Sie Journal du Geek
Zwillinge kümmern sich um den Rest
Das Konzept von Whisk ist einfach: Man muss es nur tun Ziehen Sie Bilder in das Generierungstool um ein neues zu generieren. Es sind drei Referenzbilder erforderlich: eines für das Motiv, eines für die Szene und eines für den grafischen Stil des Bildes. Sobald diese Informationen eingegeben sind, startet Gemini: Der Bot schreibt eine detaillierte Beschreibung jedes Modellsbevor Letzteres in Imagen 3 eingeführt wurde, dem neuesten Bildgenerationsmodell der Firma Mountain View.
Und Urheberrecht?
Diejenigen, die bereits über die Missachtung von Urheberrechten und geistigem Eigentum klagen, seien beruhigt, verspricht das Unternehmen: „Dieser Prozess erfasst die Essenz Ihres Motivs und nicht eine exakte Nachbildung. So können Sie Ihre Themen, Szenen und Stile ganz einfach auf originelle Weise neu mischen„. Mit dieser Haltung Google möchte vermeiden, dass sich die schlechte Presse von ChatGPT wiederholt und den übrigen Textgeneratoren wird regelmäßig vorgeworfen, ohne Genehmigung Texte zu kopieren, für die sie nicht über das geistige Eigentum verfügen.
Konkreter: „Whisk extrahiert nur einige Schlüsselmerkmale aus Ihrem Bild und kann Bilder erzeugen, die von Ihren Erwartungen abweichen. Beispielsweise kann das generierte Motiv eine andere Größe, ein anderes Gewicht, eine andere Frisur oder einen anderen Hautton haben“, warnt Google. Es ist jedoch möglich, die spezifischen Details eines Bildes weiter zu verfeinern um Textdetails hinzuzufügendieses Mal durch eine klassische Eingabeaufforderung.
Derzeit ist Whisk nur in der eingeschränkten Vorschau in den USA verfügbar. Google wird zweifellos auf das erste Feedback von Internetnutzern warten, um seine Technologie zu verfeinern, bevor es über einen breiteren Einsatz im Rest der Welt nachdenkt.
???? Um keine Neuigkeiten im Journal du Geek zu verpassen, abonnieren Sie Google News. Und wenn Sie uns lieben, haben wir jeden Morgen einen Newsletter.