Ein neues I/O für eine neue Generation

Ein neues I/O für eine neue Generation
Ein neues I/O für eine neue Generation
-

Wir haben in den letzten Monaten Gemini 1.5 Pro mit langem Kontext und der Vorschau eingeführt. Wir haben eine Reihe von Qualitätsverbesserungen in den Bereichen Übersetzung, Codierung und Argumentation vorgenommen. Ab heute werdet ihr sehen, dass sich diese Aktualisierungen im Modell widerspiegeln.

Sie können auch mehr darüber lesen und es verwenden, wenn Sie es verwenden Version von Gemini 1.5 Pro Entwickler*innen weltweit zur Verfügung stellen. Darüber hinaus ist Gemini 1.5 Pro mit 1 Million Kontext jetzt direkt für Nutzer*innen in Gemini Advanced verfügbar und kann in 35 Sprachen verwendet werden.

Erweiterung auf 2 Millionen Token in der privaten Vorschau

Eine Million Token eröffnet völlig neue Möglichkeiten. Das ist es, was passiert, aber es passiert nicht, aber es spielt keine Rolle, was es ist.

Dehalb erweitern wir heute das Kontextfenster auf 2 Millionen Token und stellen es Entwickler*innen en der privaten Vorschau zur Verfügung.

Das ist toll, zurückzublicken und zu sehen, wie viele Fortschritte wir in ein paar Monaten gemacht haben. Und es ist ein weiterer Schritt auf unserer Reise zum ultimativen Ziel eines unendlichen Kontexts.

Wir bringen Gemini 1.5 Pro in Workspace

Bisher haben wir über zwei technische Fortschritte gesprochen: Multimodalität und langen Kontext. Jeder für sich ist beeindruckend. Aber gemeinsam erschließen sie tiefere Fähigkeiten und mehr Intelligenz.

Das wird in Google Workspace sichtbar.

Unsere Nutzer*innen durchsuchen ständig ihre E-Mails in Gmail. Bevor Sie beginnen, erlaubt Ihnen der Zwilling nichts zu tun. Als Elternteil möchtet ihr beispielsweise über alles informiert sein, was in der Schule eures Kindes vor sich geht. Zwillinge können Ihnen auch helfen, wenn Sie sehen möchten, was passiert.

Bitte beachten Sie, dass die gebissenen Zwillinge aktuelle E-Mails Ihrer Schule enthalten. In der Mitte der jeweiligen E-Mails werden diese gekennzeichnet und können so mit PDFs analysiert werden. Ihr erhaltet eine Zusammenfassung der wichtigsten Punkte und Aktionen. Für ältere Zeiten der Woche gelten keine weiteren Bedingungen. Die Aufzeichnung des Treffens dauert eine Stunde. Wenn sie von Google Meet stammt, könnt ihr Gemini gebissen, euch die Highlights zu nennen. Es ist eine Gruppe von Menschen, es geht nicht nur um die Zeit, sondern um die Tag Zeit. Zwillinge können natürlich sein und ihre Reaktion wird wachsen.

Dies sind ungezackte weitere Teile, mit Gemini das Leben einfacher imachen kann. Gemini 1.5 Pro ist in Workspace Labs verfügbar. Jetzt können Sie weitere Details sehen.

Audioausgänge in NotebookLM

Wir haben uns gerade ein Spiel mit Textausgaben angelesehen. Aber mit einem multimodalen Modell können wir noch viel mehr tun.

Wir machen hier Fortschritte, und es werden noch weitere folgen. Audioübersichten in NotebookLM zeigen den Fortschritt. Dies ist eine Gemini-Version, von der eine aus verrücktem Material und einer personalisierten und interaktiven Audiokonversation besteht, die generisch ist.

Das ist die Chance der Multimodalität. Bald können Sie Ihre Ein- und Ausgänge kombinieren und anpassen. Das meinen wir, wenn wir sagen, dass es sich um einen I/O für eine neue Generation handelt. Aber was wäre, wenn wir noch weiter gehen könnten?

Mit KI-Agenten noch weiter gehen

Wir sehen alle anderen Artikel, aber die KI-Agenten wurden bereits kontaktiert. Ich betrachte sie als intelligente Systeme, die sich durch Denkvermögen, Planung und Gedächtnis auszeichnen, mehrere Schritte vorausdenken können, software- und systemübergreifend arbeiten, alles, um etwas für euch zu erledigen und vor Germem unter eurer Aufsicht.

Bevor Sie es in den Anfängen belassen, aber lassen Sie mich Ihnen zeigen, welche Anwendungsfälle wir zur Zeit bearbeiten.

Beginnen wir mit dem Einkaufen. Hier geht es um den Spaß, Schuhe zu kaufen, aber viel weniger Spaß, sie zurückzugeben, wenn sie nicht passen.

Stellt euch vor, Gemini könnte alle Schritte für euch erledigen:

Durchsucht euren Posteingang nach der Bestellbestätigung bzw. Rechnung…

Finden Sie die beste Nummer in Ihrer E-Mail…

Füllt ein Rücksendeformular aus…

Vereinbart sogar eine Abholung durch einen Paketdienstleister.

Ist das alte Ding, wo?

Nehmen wir ein anderes Beispiel, das etwas komplexer ist: Angenommen, ihr seid gerade nach Chicago gezogen. Stellt euch vor, wie Gemini und Chrome zusammenarbeiten, um euch dabei zu helfen, euch auf eine Reihe von Dingen vorzubereiten – etwas für euch zu organisieren, zu argumentieren und zusammenzufassen.

Ihr möchtet beispielsweise die Stadt erkunden und nach Dienstleistungen in der Nähe suchen – von der Reinigung bis zu Hundesittern. Und ihr müsst eure neue Adresse auf Dutzenden von Websites aktualisieren.

Zwillinge können Ihnen weitere Einzelheiten mitteilen und Sie werden die folgenden Informationen sehen können – also behaltet ihr immer die Kontrolle.

Und diese Aspekte sind die gleichen – wenn es sich um Prototypen handelt, wird intensiv darüber nachgedacht, wenn die Matrizen auf der rechten Seite sind, sind sie privat und sie sind sehr einfach und funktionsfähig.

Wenn es um unvollständige Anwendungsfälle geht, aber sie vermitteln euch einen guten Eindruck von den Arten von Problemen, die wir lösen möchten, indem wir intelligente Systeme bauen, die für euch vorausdenken, argumentieren und planen.

Was bedeuten diese Entwicklungen für unsere Mission?

Geminis Leistungsfähigkeit – mit Multimodalität, großem Kontextfenster und KI-Agenten – bringt unser großes Ziel näher: KI für alle nützlich und leicht zugänglich zu machen.

Wir sehen darin einen großen Fortschritt bei der Realität unserer Mission: Die Informationen der Welt zu organisieren, ganz gleich wie sie eingegeben werden, sie über alle Geräte zugänglich zu machen und die Informationen der Welt mit den Informationen in EURER Welt auf eine für euch wirklich nützliche Weise zu kombinieren.

Neue Wege beschreiten

Sobald der KI die volle Kraft entzogen ist, muss sie erneut entfernt werden. Das Google DeepMind-Team hat hart daran gearbeitet.

Wir haben so viel Begeisterung rund um 1.5 Pro und sein langes Kontextfenster gesehen. Aber wir haben auch von Entwickler*innen gehört, dass sie etwas schnelleres und kostengünstigeres wollten. Deshalb stellen wir Gemini 1.5 Flash vor, ein einfacheres Modell, das skalierbar ist. Dies dient der optimalen Optimierung, erfordert jedoch keine Verzögerungen und Kosten. 1.5 Flash ist in AI Studio und Vertex AI verfügbar.

Mit Blick auf die Zukunft wollten wir schon immer einen universellen KI-Agenten entwickeln, der im Alltag nützlich ist. Project Astra zeigt multimodales Verständnis und kann Gespräche in Echtzeit führen.

-

PREV Tod von Marie Colette NANA geb. SANKARA: Danke und Ankündigung
NEXT China erklärt einen gnadenlosen Preiskampf bei Elektroauto-Batterien, aber Vorsicht vor den Konsequenzen