KI und Bibliothek: der Test von 6

KI und Bibliothek: der Test von 6
KI und Bibliothek: der Test von 6
-
Die BNF François-Mitterrand im 13. Arrondissement von Paris. – Foto © PHILIPPE GUIGNARD
Die Dänische Nationalbibliothek in Kopenhagen. – Foto FANNY GUYOMARD

1. Katalogisieren Sie (endlich!) die Sammlungen …

Im Herzen von Brüssel bewahrt die Königliche Bibliothek Belgiens (KBR) auf acht Hektar fast acht Millionen Objekte auf. „Jede Etage hat einen Geruch“ hume Sophie Vandepontseele, Leiterin zeitgenössischer Sammlungen. Jeden Monat gelangen mehr als 3.000 Papierbücher in die gesetzliche Hinterlegung. Der 17-stöckige Bücherturm sieht aus wie Geisterjäger ist fast voll. Und am Ende des ersten Viertels des 21e Jahrhundert existiert ein Werk nicht wirklich, wenn es nicht im Internet katalogisiert ist. Gold „Wir haben vor ein paar Jahren festgestellt, dass die Hälfte unserer Sammlungen nicht online identifiziert wurde.“ weist auf den Bibliothekar hin. Im Jahr 2022 startete KBR daher gemeinsam mit Microsoft eine Anwendung, die die ersten Seiten jedes Werkes fotografiert und – hier kommt künstliche Intelligenz ins Spiel – die Metadaten auf einen Blick identifiziert. Das Dokument ist jetzt indexierbar. In diesem Jahr weitet KBR diese Anwendung auf die gesetzliche Hinterlegung aus. „Ziel ist es, die Zeit zwischen ihrer Ankunft hier und ihrer Katalogisierung auf einige Wochen zu verkürzen. »

2. … dann transkribieren Sie sie im Internet … und schützen Sie sie vor KI!

Ein weiteres Projekt für KBR: Mit Google bis 2026 100.000 Dokumente digitalisieren. Heute sind nur 10 % der belgischen Nationalsammlungen digitalisiert. Genug, um ihr Publikum zu erweitern. Die Institution Library and Archives Canada verwendet die Transkribus-Software, um handgeschriebene Zeichen zu erkennen und sie in ein digitales Format umzuwandeln, damit sie im Internet lesbar sind. „Das Pilotprojekt zielte auf Dokumente ab, die von der Regierungsabteilung, früher bekannt als Indian Affairs, erstellt wurden. Ungefähr fünf Millionen Seiten dieser Sammlung sind auf der Canadiana-Website zugänglich. Mit Regisseur Leslie Weir. Dieses Projekt unterstreicht das tiefe Engagement unserer Organisation für die Versöhnung mit indigenen Völkern sowie unsere wichtige Rolle als Verwalter und Quelle wertvoller Aufzeichnungen. » Dieser Wächter ist umso wichtiger angesichts der KI, die in der Lage ist, neue Inhalte zu generieren, die die Realität verzerren können. Die Bibliothek kann diese Verzerrungen erkennen, indem sie sie mit den von ihr aufbewahrten Originaldokumenten vergleicht. Und dass es dafür sorgt, dass es im Falle einer Änderung oder eines Datenverlusts in mehreren Kopien gespeichert wird.

3. Fördern Sie digitalisierte Inhalte

Die Katalogisierung ermöglicht es, die Existenz eines Dokuments zu ermitteln, und seine Digitalisierung ermöglicht den Zugriff darauf von einem mit dem Internet verbundenen Gerät aus. Aber wie navigiert man durch diese Masse? Das Nationale Institut für Forschung in digitalen Wissenschaften und Technologien (Inria) und das Nationale Audiovisuelle Institut (Ina) haben das GallicaSnoop-Tool entwickelt, benannt nach der digitalen Bibliothek der Bibliothèque nationale de und „snoop“ auf Englisch: Seine Luchsaugen erkennen die Ähnlichkeiten zwischen Hunderttausenden Bildern. Genug, um Forschern einen effektiven Vergleich der Ikonographie im Laufe der Zeit zu ermöglichen, um die Affen zu lokalisieren, die die Ränder mittelalterlicher Manuskripte bevölkern, um Fahrzeuge zu identifizieren, die erfunden wurden, um auf dem Wasser zu laufen … Das Konzept existiert auch für die antike Presse (NewsEye-Projekt). Umwandlung von Bildpixeln in digitalen Text, Identifizierung von - und Ortsnamen, Erstellung von Schlüsselwörtern und Filtern… Von der Universität La Rochelle koordinierte Arbeit mit den Nationalbibliotheken Frankreichs, Österreichs, Finnlands und anderen europäischen Universitäten.

4. Bewahren Sie das physische Erbe

KI-Intelligenz basiert auf der Identifizierung von Ähnlichkeiten zwischen Tausenden von Daten. Sobald sie die wichtigsten Gesetze identifiziert hat, die dieses System zu strukturieren scheinen, beispielsweise grammatikalische Regeln, kann sie Vorhersagen treffen. Darin bestand das Dalgocol-Universitätsprojekt, bei dem Millionen von BnF-Dokumenten verwendet wurden: deren Verfallszustand vorherzusagen, indem ihre Metadaten abgeglichen wurden. Diese geben Aufschluss darüber, um welches Medium es sich handelt, welche unterschiedlichen Behandlungen durchgeführt wurden… Diese große Vorarbeit spart später Zeit: Die Erstellung eines Kalenders, der angibt, welches Dokument, das in den Reserven schlummert, vorrangig aufbewahrt werden muss.

5. Helfen Sie mit, zuverlässige Inhalte zu erstellen

Die Art und Weise, wie Konversationsagenten Informationen verarbeiten, sie dann sortieren und dann Texte generieren, ist sehr undurchsichtig. Wie können wir ihm vertrauen? Indem wir Bibliotheken als Garanten verlässlichen Wissens auffordern, Förderer der KI zu sein. Dies tun die Nationalbibliothek von Frankreich und die INA für ein Konsortium von Unternehmen: Mistral AI entwickelt ein großes Open-Source-Modell in französischer Sprache auf der Grundlage ihrer Millionen von Daten, Giskard ist für die Bewertung der Zuverlässigkeit der Inhalte und ihrer Daten verantwortlich Sicherheit, und Artefact macht alles für Unternehmen nutzbar. Dies ist auch in der Pipeline der Königlichen Bibliothek von Dänemark, wie Cecile Christensen, Direktorin für digitale Transformation, uns erklärt: Die Internetarchive des Landes können zu einem großen dänischen Sprachmodell führen, das als Nahrung für alternative Konversationsagenten dienen könnte American ChatGPT zum Beispiel. Der Algorithmus wäre „eine offene Quelle und transparent“, präzisiert dieser Jurastudent, der sich in Gesprächen mit Schweden und Norwegen befindet. „Es wird immer voreingenommen sein, denn jede Entscheidung beinhaltet eine Voreingenommenheit, aber es werden unsere Voreingenommenheiten sein! » Und zum Schluss: „Dies würde es unserer Bibliothek ermöglichen, in eine neue Ära einzutreten und eine vollwertige Rolle in unserer Demokratie zu spielen.“ »

„Lasst uns nicht länger den Sirenen des Techno-Solutionismus nachgeben“

„Lassen Sie uns nicht über die Auswirkungen und Möglichkeiten von KI in Bibliotheken für die Erstellung bibliografischer Datensätze oder Inhaltsempfehlungen fantasieren. Nationalbibliotheken mussten nicht auf den Aufstieg der KI warten, um ihre Aufgaben zu erfüllen. Die mögliche Zeitersparnis bei dieser Art von Aufgabe gleicht nicht die CO2-Auswirkungen dieser Technologien und ihre Kosten für Entwicklung und Wartung aus. Heutzutage gibt es weniger energieverbrauchende Technologien, die die Dokumentationsrecherche erleichtern. Eine ergonomische Benutzeroberfläche und die Arbeit an der Sichtbarkeit von Bibliotheken und ihren Sammlungen im gesamten Web sind mehr als genug, um Benutzern die Suche nach Dokumenten zu erleichtern. Dies ist auch ein Prozess, an dem sich Bibliotheken seit mehreren Jahren beteiligen. Die meisten generativen KI-Dienste wie ChatGPT, Gemini und Midjourney werden von Webgiganten bereitgestellt, deren Infrastruktur auf Rechenzentren basiert, die Strom und Wasser zu ihrer Kühlung verbrauchen. Die Alternative besteht darin, KI zu verwenden, die wir direkt auf unseren Maschinen installieren, wie z. B. Jan.AI, ohne mit anderswo gehosteten Servern kommunizieren zu müssen. Dadurch behalten wir auch die Kontrolle über unsere Daten. Lassen Sie uns nicht länger den Sirenen des Techno-Solutionismus nachgeben. Machen wir Platz für eine ethische, vernünftige und bürgerschaftliche digitale Technologie. Es ist nicht der Wettlauf um den Einsatz der neuesten modischen Technologie, der uns für unsere Nutzer attraktiver oder moderner macht, sondern vielmehr unsere Fähigkeit, einen Schritt zurückzutreten, zu unterstützen und die Menschen zum Nachdenken über die Auswirkungen und Folgen der digitalen Technologie in unserer Gesellschaft anzuregen. »

-

PREV Feiertage zu Allerheiligen: Bücher, Comics, Videospiele, Brettspiele … Ideen, um die Kinder zu Hause zu beschäftigen
NEXT „The Lost Children Club“ von Rebecca Lighieri: Miranda aus der Hölle