Gezielter suchen

ows

Ein offen nutzbarer Web-Index für die Suche ist das Ziel von OpenWebSearch.EU

Eine Online-Suche speziell für Wissenschaft und Forschung, für Wirtschaftskennziffern und Umweltstatistiken oder für Kunst und Kultur: Wer jemals bei Google, Bing, Baidu oder Yandex mit besonderen Fragen scheiterte und dafür auch in den Social Media keine Antworten fand, braucht dringend Alternativen. Die aber gibt es nicht. Noch nicht: Das europäische Forschungsprojekt OpenWebSearch.EU erarbeitet in den nächsten drei Jahren einen offenen Webindex sowie eine dezentrale IT-Infrastruktur, die auf den Systemen von mindestens fünf unabhängigen Organisationen laufen soll. Für OpenWebSearch.EU kooperieren 14 Forschungsorganisationen aus sieben europäischen Ländern, darunter auch das Leibniz-Rechenzentrum (LRZ). Das Projekt wird mit 8,5 Millionen Euro aus dem Europe-Horizon-Programm (Projektnummer: 101070014) gefördert und startet jetzt nach einem Auftakttreffen aller Beteiligten.

Alternativen zum Suchen brauchen einen offenen Index

Der offene Webindex und die dezentrale Infrastruktur bilden das Fundament für innovative Suchdienste und damit auch für Wahlmöglichkeiten bei der Recherche von Informationen. Nicht zuletzt sind neue Geschäftsmodelle rund ums Suchen auch ein Beitrag zu Europas Souveränität bei Navigations- und Recherchetechniken: „Ein offener Index ist die Grundlage für das Entstehen eines neuen Ökosystems für Such- und Discovery-Anwendungen“, stellt Michael Granitzer fest. Der Informatik-Professor der Universität Passau koordiniert die unterschiedlichen Arbeiten an OpenWebSearch.EU. „Freier, offener und unvoreingenommener Zugang zu Informationen – diese Grundprinzipien haben wir bei der Websuche verloren und müssen sie dringend wiederherstellen. Als Nutzer würde ich gerne meine Suchmaschine so wie meine Zeitung nach meinen Vorlieben wählen.“

Erste Ideen für das ehrgeizige IT-Projekt sind in einer Graswurzelbewegung aus Forschenden und Technik-Spezialist:innen entstanden. Sie gründeten 2016 die Open Search Foundation (OSF) – heute ebenfalls ein Partner von OpenWebSearch.EU – bildeten unter deren Dach Arbeitsgruppen, die seither auch an transparente Algorithmen entwickelten sowie mit offen zugänglicher Software und Technik die notwendigen Netzwerke und Systeme für OpenWebSearch.EU vorbereiteten. Das LRZ ist seit Beginn Partner der OSF, einige Mitarbeitende engagieren sich in deren Arbeitsgruppen. Für das europäische Projekt stellt es wie die anderen Rechenzentren Backend-Systeme sowie schnelle, direkt zugängliche Server und Speicher bereit. Darauf kann der offenen Web-Index berechnet, können nötige Workflows und Schnittstellen entwickelt und getestet werden. „Ein wichtiges Ziel des OpenWebSearch-Konsortiums ist die Entwicklung einer dezentralen, organisationsübergreifenden Infrastruktur, die von verschiedenen Rechenzentren betrieben werden soll“, erläutert Stephan Hachinger, promovierter Physiker und Leiter des Teams Forschungsdaten-Management am LRZ. „Gemeinsam wollen wir die Kosten, die mit deren Betrieb verbunden sind, durch umfangreiche Lasttests quantifizieren.“ Gründer:innen und Unternehmer:innen oder für Betreibergesellschaften von Rechenzentren brauchen solche Angaben, um neue Geschäftsmodelle oder Dienstleistungen mit dem offenen Web-Index zu entwickeln. „Die offene Web-Suchinfrastruktur kommt uns allen zugute“, sagt Granitzer. „Wir werden damit endlich eine echte Wahlmöglichkeit bei der Auswahl von Suchmaschinen bekommen."

Mit Ausschreibungen neue Geschäfte anregen

Den Spezialist:innen fürs Datenmanagement am LRZ kommen bei diesen Arbeiten die Erfahrungen aus dem EU-Projekt LEXIS zugute. Dabei wurde eine pan-europäische Plattform aufgebaut, die auf bestehenden Cloud-Systemen von Rechenzentren aufsetzt, verschiedene Supercomputer vernetzt und eine Auswertung von Forschungsdaten und Big Data an unterschiedlichen Standorten ermöglicht. Wie schon für LEXIS wird das LRZ mit Partnern Schnittstellen sowie einen verwalteten Datenspeicher auf Basis von EUDAT-Systemen entwickeln, der Tools für die Beschreibung sowie für den Austausch von Informationen bereitstellt. „Wir werden wahrscheinlich REST-API, Nachrichtenwarteschlangen und andere moderne IT-Techniken nutzen“, planen Hachinger und sein Team. „Auf diese Weise können Big Data-Aufgaben bequem orchestriert und automatisiert werden.“

14 Rechenzentren, Universitäten und Organisationen, insgesamt rund 75 Forschende, arbeiten bei OpenWebSearch.EU zusammen: eine Herausforderung für Koordination, Kommunikation, Management. Ebenfalls involviert ist daher das Team Research Coordination and Support (RCS) des LRZ: Es unterstützt die Projektleitung bei der Organisation von Arbeitsgruppen, außerdem bei den geplanten Ausschreibungen. 15 Prozent der Fördermittel sind für Entwicklungen und Beiträge von außenstehenden IT-Dienstleistern oder Agenturen reserviert.