Über das Projekt

Worum geht es im Projekt NewsEye?

NewsEye, finanziert durch das Forschungs- und Innovationsprogramm Horizon 2020 der Europäischen Union, ist ein Forschungsprojekt, das den Stand der Technik vorantreibt und neue Konzepte, Methoden und Werkzeuge für die digitalen Geisteswissenschaften einführt, indem es einem breiten Nutzerkreis einen verbesserten Zugang zu historischen Zeitungen bietet. Mit den von NewsEye entwickelten Tools und Methoden werden wichtige Nutzergruppen in der Lage sein, Ansichten und Perspektiven auf historische Ereignisse und Entwicklungen zu untersuchen. Das Projekt versucht die Art und Weise zu verändern, wie europäische Daten des digitalen Erbes gesucht, abgerufen, verwendet und analysiert werden.

 

Warum konzentriert sich NewsEye auf Zeitungen? 

Zeitungen versammeln Informationen über kulturelle, politische und soziale Ereignisse in einer Dichte, wie keine andere öffentliche Aufzeichnung. Seit ihren Anfängen im 17. Jahrhundert beschreibt sie Milliarden von Ereignissen, Geschichten und Namen, in fast jeder Sprache, in jedem Land, für nahezu jeden Tag. Zeitungen waren schon immer ein wichtiges Medium für die Verbreitung von öffentlichen und politischen Meinungen, aber auch literarischen Werken, Essays, Bildern und Kunst. Dieser thematische Reichtum rückt sie in den Mittelpunkt des Interesses am europäischen Kulturerbe.

In den letzten Jahrzehnten wurden Millionen Zeitungsseiten aus europäischen Bibliotheken digitalisiert und online verfügbar gemacht. Es ist damit zu rechnen, dass die Nationalbibliotheken ihre Digitalisierungsbemühungen in den kommenden Jahren aufgrund der großen Nachfrage nach Zugang zu historischen Zeitungen noch intensivieren werden. Während die breite Öffentlichkeit allgemeines Interesse an dieser historischen und kulturellen Ressource zeigt, ist sie für viele Geschichts- und Kulturwissenschafter*innen von entscheidender Bedeutung.

 

Wer ist das NewsEye Projektteam?

Das Projekt NewsEye umfasst Nationalbibliotheken, geistes- und sozialwissenschaftliche Forschungsgruppen,sowie Informatik-Forschungsgruppen (siehe unsere Teamseite!). Es befasst sich mit einer Reihe von Herausforderungen, die zu erheblichen wissenschaftlichen Fortschritten in mehrere Bereichen führen werden:

  • in der Texterkennung, Textanalyse, Sprachenverarbeitung, Computerkreativität und Sprachengenerierung, sowohl in Hinblick auf historische Zeitungen als auch im Allgemeinen.
  • in der digitalen Zeitungsforschung, wobei eine Reihe von redaktionellen Themen wie OCR und Artikeltrennung behandelt werden,
  • in den digitalen Geisteswissenschaften, in Bezug auf große Mengen an Textmaterial, Verfügbarkeit nützlicher Werkzeuge und Möglichkeiten der Suche.
  • in den Geschichtswissenschaften, hinsichtlich der Analyse historischer Güter anhand neuer Methoden in verschiedenen Sprachkorpora.

 

Was sind die Ziele des Projekts?

Das Hauptziel des geplanten NewsEye-Projekts ist die Entwicklung von Methoden und Werkzeugen für eine effektive Erforschung und Nutzung dieser Ressource mit Hilfe neuer Technologien und „Big Data“-Ansätze, welche Methoden des close readings und „fernen Lesens“ der digitalen Geisteswissenschaften kombinieren.

Diese Untersuchungsmethode wird Forscher*innen als auch Laien die  Möglichkeiten geben, einen neuen Blick auf diese europäische Ressource zu werfen.

NewsEye wird eine integrierte Sammlung von Tools und Methoden entwickeln, die die Möglichkeiten der Nutzer*innen hinsichtlich Zugriff, Analyse und Nutzung der Inhalte in den digitalen Bibliotheken historischer Zeitungen deutlich verbessern wird.

 

Werkzeuge: 

  1. Texterkennung & Artikeltrennung - dadurch werden digitalisierte Zeitungsdaten um sowohl Artikeltrennung als auch Klassifizierungsinformationen angereichert. Zusatzwerkzeuge werden weitere Textinformationen und schließlich auch Volltexttranskripte auf Artikelebene zur Verfügung stellen.
  2. Semantische Textanreicherung - produziert semantische Annotationen. Der Zugriff wird dadurch erleichtert und eine weitere systematische Analyse der Zeitungsbestände wird ermöglicht.
  3. Dynamische Textanalyse - ist eine Methode, um Themen, Trends und Standpunkte im zu untersuchenden Korpus automatisch zu finden. Dies gilt sowohl innerhalb eines bestimmten Kontextes als auch im Vergleich zwischen kontrastierenden Kontexten.
  4. Personal Research Assistant - ist eine intelligente und transparente Hilfe für Benutzer*innen, die mit Hilfe der angereicherten Texte dynamische Textanalysetools anwendet, eine Reihe von Analyseschritten durchführt und darüber hinaus die Ergebnisse erklären können soll. Der Assistent extrahiert in einem ersten Schritt die Inhalt aus einer dynamischen Abfrage für einen ersten Bericht, der dem*der Benutzer*in in natürlicher Sprache präsentiert wird. Der Assistent setzt dann die Untersuchung entweder autonom fort, oder die Benutzer*innen können Standpunkte, Artikel und Schlüsselwörter auswählen, um die gezielte Abfrage interaktiv zu verfeinern.