NewsEye-projekti

Mikä on NewsEye?

NewsEye on tutkimusprojekti, jonka rahoittaa Euroopan Unionin tutkimuksen ja innovoinnin ohjelma Horisontti 2020. NewsEye edistää ja esittelee uusia digitaalisten ihmistieteiden konsepteja, menetelmiä ja työkaluja. Projekti tuo historiallisten sanomalehtien sisällöt laajan käyttäjäjoukon ulottuville. NewsEyen kehittämillä työkaluilla ja menetelmillä keskeiset käyttäjäryhmät voivat tutkia historiallisia tapahtumia ja kehitystä eri näkökulmista. Projekti muuttaa tapaa, jolla eurooppalaista digitaalista kulttuuriperintöaineistoa haetaan, tutkitaan, käytetään ja analysoidaan.

 

Miksi NewsEye keskittyy sanomalehtiin?

Sanomalehdet keräävät tietoa kulttuurisista, poliittisista ja sosiaalisista tapahtumista yksityiskohtaisemmin kuin mikään muu julkinen arkisto. Sen jälkeen kun sanomalehtiä alettiin julkaista 1600-luvulla, niihin on kirjattu muistiin valtava määrä tapahtumia, tarinoita ja nimiä lähes kaikilla kielillä, kaikissa maissa, joka päivä. Ne ovat aina olleet tärkeä keino levittää yleisiä ja poliittisia mielipiteitä, kaunokirjallisuutta, esseitä ja taidetta. Temaattisen rikkautensa ansiosta sanomalehdet ovat keskeisiä kenelle tahansa, joka on kiinnostunut eurooppalaisesta kulttuuriperinnöstä.

Eurooppalaisissa kirjastoissa on viime vuosikymmeninä digitoitu ja avattu verkkokäyttöön kymmeniä miljoonia sanomalehtien sivuja. Historiallisten sanomalehtien runsaan kysynnän vuoksi kansalliskirjastot tehostavat digitointia tulevina vuosina. Tämä historiallinen ja kulttuurinen aineisto kiinnostaa suurta yleisöä ja on ratkaisevan tärkeä monille humanististen tieteiden tutkijoille.

 

Keitä NewsEye-projektin tiimiin kuuluu?

NewsEye-projektissa on mukana kansalliskirjastoja, humanististen ja yhteiskuntatieteiden tutkimusryhmiä ja tietojenkäsittelytieteen tutkimusryhmiä (katso lisää  tiimi-sivultamme). Projekti tähtää merkittäviin tieteellisiin edistysaskeliin useilla alueilla:

  • tekstintunnistus, tekstianalyysi, luonnollisen kielen käsittely, koneluovuus ja luonnollisen kielen tuottaminen - liittyen historiallisiin sanomalehtiin mutta myös laajemmin,
  • digitaalinen sanomalehtien tutkimus, joka kohdistuu toimituksellisiin kysymyksiin, kuten OCR ja artikkelien eristäminen,
  • digitaaliset ihmistieteet, joissa käsitellään valtavia määriä tekstimateriaalia: käyttökelpoisten työkalujen saatavuus ja mahdollisuudet hakea ja selailla,
  • historia: uudet menetelmät historiallisen aineiston analysointiin yli kielirajojen.

 

Mitkä ovat projektin tavoitteet?

NewsEye-projektin päätavoite on kehittää menetelmiä ja työkaluja historiallisten sanomalehtien runsaan tietovarannon tutkimiseen ja hyödyntämiseen käyttäen uusia teknologioita ja ”big datan” lähestymistapoja sekä digitaalisten ihmistieteiden lähi- ja kaukolukumetodeja.

Tämän seurauksena sekä tutkijat ja asiantuntijat että suuri yleisö pystyvät paremmin perehtymään eurooppalaiseen kulttuuriperintöön.

NewsEye kehittää saumattoman työkalu- ja menetelmäarsenaalin, joka parantaa käyttäjien mahdollisuuksia saavuttaa, analysoida ja käyttää digitaalisten historiallisten sanomalehtikirjastojen sisältöjä.

Työkalut:

  1. Tekstintunnistus ja artikkelien eristäminen – rikastaa digitoitua sanomalehtidataa artikkelien eristämisellä ja luokittelutiedoilla sekä tekstuaalisilla lisätiedoilla ja lopulta kokonaisilla artikkeliteksteillä.
  2. Semanttinen tekstin rikastaminen – tuottaa semanttisia lisätietoja, jotka helpottavat sanomalehtikokoelmien käyttämistä ja mahdollistavat niiden kehittyneen systemaattisen analysoinnin.
  3. Dynaaminen tekstianalyysi – kehittää automaattisia menetelmiä aiheiden, suuntausten, näkökulmien ja poikkeusten etsimiseen tutkittavasta kieliaineistosta sekä tietyn kontekstin sisällä että eri konteksteja vertailtaessa.
  4. Henkilökohtainen tutkimusavustaja – on käyttäjän älykäs ja läpinäkyvä avustaja, joka rikastettuja tekstejä ja dynaamisia tekstin analysointityökaluja käyttäen tekee sarjan analysointitoimenpiteitä ja selittää tulokset käyttäjälle. Avustaja louhii sisältöä dynaamisen kyselyn avulla ja esittelee alustavan raportin luonnollisella kielellä. Sen jälkeen avustaja voi jatkaa tutkimusta itsenäisesti tai käyttäjät voivat hioa kyselyä valitsemalla näkökulmia, artikkeleita ja avainsanoja.