2.2.4.7 Verknüpfung der Metadaten mit externen Wissensquellen ausbauen

Frage

Wie können Linked Data Konzepte im OER-Umfeld sinnvoll genutzt werden?

Der Begriff "Linked Open Data" (LOD) bezeichnet eine Community-Bestrebung, innerhalb derer Regeln und Best Practices definiert werden, um große Datensätze an offenen Metadaten maschinenlesbar zu veröffentlichen und mittels semantischer Techniken miteinander in Beziehung zu setzen.

Tim Berners-Lee definierte dazu folgende vier Regeln:

  1. Benutze Uniform Resource Identifiers (URIs) als Namen für Dinge.
  2. Benutze HTTP URIs, so dass diese Namen nachgeschlagen werden können.
  3. Wenn jemand eine URI nachschlägt, liefere nützliche Informationen und nutze dabei die Standards RDF* und SPARQL.
  4. Füge Links zu anderen URIs bei, so dass der User weitere Dinge entdecken kann.

Diese ständig wachsende Wissensbasis wird als Linked Open Data Cloud (LOD Cloud) bezeichnet und beinhaltet aktuell über 28 Milliarden RDF-Triple aus ca. 650.000 Datenquellen.

Im OER Umfeld existieren bereits interessante LOD-Datenquellen, die mit OER Materialien verknüpft werden könnten, z. B.:

Wikidata ist eine umfassende frei bearbeitbare Wissensdatenbank, die von der Wikimedia Foundation u.a. zur Unterstützung der verschiedensprachigen Wikipedia-Instanzen mit einheitlichen strukturierten Daten betrieben wird. Ein aktuelles Beispielprojekt, das auf Wikidata basiert, ist Science Stories, das eindrucksvoll die Möglichkeiten zeigt.

Der LOD-Dienst des hbz stellt die Gemeinsame Normdatei (GND) mit über 15 Millionen LOD-Datensätzen zu Personen, Körperschaften, Kongresse, Geografika, Sachschlagwörter und Werktitel zur Verfügung.

Die Kompetenzrahmen im gesamten Bundesgebiet könnten in maschinenlesbarer Form erstellt (siehe Herausforderung "Kompetenzbasierte Lernprozesse unterstützen") und als Linked Open Data veröffentlicht werden.

Um dieses Wissen der einzelnen Datenquellen zusammenzufassen, ist es zwingend erforderlich, entsprechende Klassen von Ressourcen und Properties, sowie deren Zusammenhänge zu definieren, auf deren Basis dann die einzelnen Datenquellen ihre strukturierten Daten herausgeben können.

Die Initiative schema.org stellt so eine Ontologie für die Strukturierung von Daten auf Webseiten zur Verfügung. Im Bildungsbereich wurde der LRMI-Standard von der Dublin Core Metadata Initiative herausgegeben, um auf Basis von schema.org Bildungsressourcen beschreiben zu können.

Durch die Verknüpfung der OER Materialien mit der LOD Cloud wäre es zum Beispiel möglich, bei der Suche nach OER Materialien über eine Stadt anbieten zu können, den Suchkontext auf die entsprechende Region bzw. das jeweilige Bundesland auszuweiten, indem man die Verknüpfung von den OER Metadaten zu einer LOD Ressource verfolgt und iterativ in die Suche einbezieht. Man könnte des weiteren auch Materialien von berühmten Personen/Gebäuden aus der Region finden und so weiter und so fort.

Wenn man die Metadaten der OER Materialien als Linked Open Data veröffentlicht, dann könnte das veröffentlichte Materialien auch wiederum Teil der LOD Cloud werden. Somit wäre es dann zum Beispiel möglich, OER Materialien zu finden, die in ihren Metadaten nicht direkt den Bezug zu einer LOD Ressource aufweisen, aber Bestandteile mit dem Bezug dazu besitzen.

Entweder werden die generierten LODs von der OER Datenquelle direkt in die Website für das jeweilige OER Material eingebettet oder explizit mittels Content Negotiation zur Verfügung gestellt. Bei Einsatz von PID-Systemen könnte dies von den eingesetzten PID-Services (siehe Herausforderung "Konsistenz der Metadaten beim OER-Remix sicherstellen") übernommen werden, da sie auch die Metadaten des veröffentlichen OER Materials vorhalten und diese als LOD bei der PID-Auflösung mittels Content Negotiation direkt ausgeben könnten. Eine Weiterleitung auf die jeweilige OER Datenquelle würde dann wegfallen.