CLARIN Centre Vienna / Language Resource Portal

CCVs Hauptaufgabe ist es, Forschern und Forscherinnen in den Sozial- und Geisteswissenschaften möglichst einfachen und dauerhaften Zugang zu digitalen Sprachressourcen und Sprachtechnologie zu bieten. CCV bietet auch Langzeitarchivierung für österreichische Sprachressourcen. Zu diesem Zweck betreibt das CCV das Sprachressourcenportal (LRP), ein Repositorium zur Archivierung und Publikation unterschiedlicher digitaler Sprachressourcen. Die gegenwärtig verfügbaren Ressourcen stellen nur eine erste Auswahl dar, die Sammlung wird laufend um weitere Ressourcen erweitert.

Das LRP verfolgt einen zweifachen Ansatz indem es Anwendern direkten Zugang zu den Quelldaten gewährt und gleichzeitig aber auch Zugang über angepasste Schnittstellen mit fortgeschrittenen Such- und Browseoptionen bietet. So können die publizierten Daten auf unterschiedliche Arten untersucht werden.

Das Herzstück des Sprachressourcenportals baut auf der lange erprobten, gut etablierten fedora-commons Software für Repositorien auf, die das OAIS (Open Archival Information System) Referenzmodel implementiert. Die Such- und Datendarstellungsebenen werden von dem open-source Framework corpus_shell übernommen, welches am Institut für Corpuslinguistik und Texttechnologie der Österreichischen Akademie der Wissenschaften entwickelt wird. Durch diese Lösungen werden die Basiskriterien für ein hochwertiges Repositoriums erfüllt: Persistente Identifikatoren, Federated Identity, Nutzung von Standard-Formaten und die gemeinsame?? Nutzung von Daten und Metadaten.??

Die Metadaten der Sprachressourcen werden über einen OAI-PMH-Provider-Service zur Verfügung gestellt, der in regelmäßigen Abständen vom CLARIN-ERIC geharvested wird und in die gemeinsame Metadatendomaine integriert ist. Auf diese Art stellt das CCV einen weiteren wichtigen Disseminationskanal für die publizierten Daten zur Verfügung. Um sich einen Überblick über alle über CLARIN verfügbaren Ressourcen aus ganz Europa zu machen, empfiehlt es sich, das Virtual Language Observatory zu besuchen.

Contact: acdh-tech@oeaw.ac.at

Siehe auch: