Die explosionsartige Zunahme der Zahl der Rechenzentren lässt die Stromkosten in den USA steigen. Und bald in Frankreich?

Grundsätzlich ist die Rechenleistung das wichtigste Element, das benötigt wird.

Auf der Datenseite sind 3 Fälle zu unterscheiden:

ein Modell trainieren,
die einfache Ausführung eines bestehenden Modells,
die Nutzung eines bestehenden Modells mit Zugriff auf zusätzliche Daten.

Für das Training benötigen Sie einen riesigen Datenbestand, möglicherweise angereichert mit Metadaten zum Lernen (für ein Bilderkennungsmodell verfügen wir beispielsweise über einen großen Bestand an Bildern und für jedes Bild Anmerkungen, die deren Inhalt beschreiben, die im Allgemeinen von einem Menschen erstellt werden). oder eine andere KI und dann von einem Menschen verifiziert). Diese Daten stammen oft aus dem Internet, aber aus Gründen der Leistung und Reproduzierbarkeit ist es sehr vorzuziehen, sie lokal zu kopieren (ein entferntes Bild wird durch seine URL identifiziert, sein Inhalt kann sich möglicherweise ändern usw.).

Um ein Modell zu verwenden, sind die einzigen Daten, die benötigt werden, das Modell selbst (einige Dutzend oder Hunderte GB, abhängig von der Größe des Modells, um auf allen Knoten repliziert zu werden).

Um ein Modell mit Anreicherung zu nutzen, ist es auch notwendig, Anreicherungsdaten bereitzustellen, dort ist es jedoch nicht unbedingt notwendig, diese im Rechenzentrum zu speichern, sie können über eine externe Suchmaschine durchsucht werden. Die Idee auf dieser Ebene besteht darin, dass wir, wenn Sie Ihrem Modell etwas stellen, nicht einfach die Rohfrage an das Modell übergeben und es alleine beantworten lassen, sondern eine Vorverarbeitung durchführen, die auf der Grundlage der Frage Dokumente abruft, die für das Thema relevant sein könnten. Anschließend werden diese Dokumente mit der Frage an das Modell gesendet, um sie bei der Erstellung der Antwort zu verwenden. Theoretisch können Sie also durchaus eine einfache Abfrage in einer öffentlichen Suchmaschine durchführen, um Dokumente abzurufen und zu verwenden, ohne sie im DC speichern zu müssen. In der Praxis werden wir in der Regel immer noch bessere Ergebnisse erzielen, wenn der Dienst wie eine Suchmaschine einen eigenen Index aufbaut, da der Index dann für diese Verwendung optimiert werden kann. Insbesondere werden wir in der Lage sein, unseren eigenen semantischen Proximity-Suchalgorithmus in natürlicher Sprache zu verwenden, der aus der Semantik des KI-Modells abgeleitet werden kann, um Dokumente zu finden, anstatt durch die Fähigkeiten einer Suchmaschine „eingeschränkt“ zu sein , nicht unbedingt immer sehr gut für natürliche Sprache.

Im letzteren Fall speichern wir daher zusätzlich zum Modell zumindest den Index und möglicherweise auch einen Teil der Dokumente, die zu seiner Erstellung verwendet wurden, aber nicht alle, das würde schnell zu groß werden … Wir lieber Behalten Sie eine Referenz bei, und schade, dass wir das Dokument aus dem Index entfernen, wenn es nicht mehr zugänglich ist.

Related posts