Durch künstliche Intelligenz generierte Forschung stellt eine Bedrohung für das gesellschaftliche Wissen und das öffentliche Vertrauen in die Wissenschaft dar. Zu diesem Schluss kommt eine Studie von Forschern der Swedish School of Library and Information Science der Universität Borås, die kürzlich mehr als hundert verdächtige KI-generierte Artikel in der Suchmaschine Google Scholar identifiziert haben.
Ihr Bericht hebt hervor, dass Google Scholar mit KI-gefälschten wissenschaftlichen Artikeln überschwemmt wird. Diese Erkenntnisse zur KI-gestützten Wissenschaft verdeutlichen, dass böswillige Akteure falsche Forschungsergebnisse in großem Umfang, oft zu geringeren Kosten, zur Verfügung stellen und verbreiten können. Diese Studie wurde in der Zeitschrift veröffentlicht Überprüfung der Fehlinformationen der Harvard Kennedy School.
Jutta Haider und Björn Ekström, assoziierte Forscher an der Swedish School of Library and Information Science, sowie Kristofer Söderström von der Universität Lund und Malte Rödl von der Swedish University of Agricultural Sciences verdeutlichen die Gefahren, die dies sowohl auf gesellschaftlicher Ebene als auch für die Zukunft mit sich bringt der wissenschaftlichen Gemeinschaft.
Erhöhtes Risiko der Beweismanipulation
Eine der größten Bedenken im Zusammenhang mit KI-gestützter Forschung ist das Risiko der strategischen Manipulation von Beweismitteln, die als „Evidence Hacking“ bezeichnet wird.
„Die Risiken eines Phänomens, das wir „Evidence Hacking“ nennen, nehmen mit der Verbreitung KI-generierter Suchanfragen in Suchmaschinen erheblich zu. Dies kann zu echten Konsequenzen führen, da fehlerhafte Ergebnisse die Gesellschaft und verschiedene Bereiche durchdringen können“, sagte Ekström, der in Bibliotheks- und Informationswissenschaft promoviert hat.
Forscher haben bereits beobachtet, dass sich diese problematischen Artikel auf andere Teile der Online-Rechercheinfrastruktur ausgeweitet haben, darunter verschiedene Archive und soziale Medien. Die Verbreitung erfolgt rasant und Google Scholar macht diese problematischen Artikel sichtbar. Selbst wenn diese Artikel entfernt werden, besteht weiterhin das Risiko, dass sie bereits Zeit hatten, sich zu verbreiten und weiter im Umlauf zu sein.
Darüber hinaus verkompliziert die KI-gestützte Forschung das ohnehin schon überlastete Peer-Review-System noch weiter.
-Fordert eine bessere Informationskultur
Die Verbreitung KI-generierter Suchanfragen in Suchmaschinendatenbanken stellt erhöhte Anforderungen an die Nutzer dieser Online-Informationen.
„Wenn wir den Forschungsergebnissen, die wir sehen, nicht vertrauen können, laufen wir Gefahr, Entscheidungen auf der Grundlage falscher Informationen zu treffen. Aber es geht nicht nur um wissenschaftliches Fehlverhalten, sondern auch um Medien- und Informationskultur“, fügte Haider, Professor für Bibliotheks- und Informationswissenschaft, hinzu.
Sie betont, dass Google Scholar keine akademische Datenbank sei. Obwohl die Suchmaschine einfach zu bedienen und schnell ist, mangelt es ihr an Verfahren zur Qualitätssicherung. Dies ist in den Standard-Suchergebnissen von Google bereits ein Problem, wird aber für die Zugänglichkeit von Wissenschaft noch kritischer.
„Die Fähigkeit der Menschen zu bestimmen, welche Zeitschriften und Verlage hauptsächlich peer-reviewte Forschung veröffentlichen, ist von grundlegender Bedeutung für die Identifizierung zuverlässiger Forschung, die für die Entscheidungsfindung und Meinungsbildung von wesentlicher Bedeutung ist“, schlussfolgerte Haider.
Weitere Informationen:
Jutta Haider et al., Von GPT erstellte wissenschaftliche Arbeiten auf Google Scholar: Hauptmerkmale, Verbreitung und Implikationen für die Verhinderung von Beweismanipulation, Überprüfung der Fehlinformationen der Harvard Kennedy School (2024). DOI: 10.37016/mr-2020-156
Herausgegeben von
Universität Borås
Zusammenfassend lässt sich sagen, dass die Verbreitung KI-generierter wissenschaftlicher Artikel grundlegende Fragen zum Vertrauen in die Forschung aufwirft. Wie können wir die Mechanismen stärken, um authentische Wissenschaft von automatisch generierten Inhalten zu unterscheiden? Dieses Thema sollte im Mittelpunkt zukünftiger Diskussionen stehen, um die wissenschaftliche Integrität zu wahren.
---