Aineistojen laadusta

Tällä hetkellä eräs ilmalaserskannauksenaineistojen arkeologisen hyödyntämisen merkittävimpiä kehittäjiä on saksalainen Ralf Hesse. Ralf on maantieteilijä, joka palkattiin uraauurtavaan projektiin kartoittamaan koko Baden-Württenbergin osavaltion ilmasta havaittavat muinaisjäännökset.

Baden-Württenbergin kartoitus on hämmästyttävä yhden miehen urakka, sillä Ralf kartoittaa, rakentaa tietokantaa, kehittää aineiston visualisointimenetelmiä, tutkii, julkaisee ja opettaa samanaikaisesti. Kuka olikaan sitä mieltä, että valtiollisen puolen toimijat ovat laiskoja ja saamattomia 😉

Projektin määräaikaisuudesta johtuen Ralfilla on tiukka 30 km2 päivätavoite, mutta käytännössä työtahtina on käsitellä 22 km2 alue kokonaisalulueen ollessa yli 35 000 km2. Päivässä hän kartoittaa keskimäärin 700 piirrettä/kohdetta. Kuten aina arkeologiassa, jäännökset ovat osin tuhoutuneita, ajallisesti kerrostuneita ja loppujen lopuksi varsin sotkuisia, mutta kaikesta huolimatta työstä on avautunut täysin uudenlainen ikkuna menneisyyteen. Samalla on syntynyt myös uusia kysymyksiä sekä tutkimuksen että alueiden hoidon suhteen.

Tutustuessani Ralfin tuoreeseen esitykseen (pääset siihen klikkaamalla kuvaa), mieleeni muistui keskustelu eräällä Ralfin luennolla pari vuotta sitten. Keskustelimme aineistojen laadusta, sillä hämmästelin, kun slovenialaiset kollegat kehittelivät työkaluja virheiden poistamiseen aineistoista. Virheiden poistamisella tarkoitetaan tässä tapauksessa systemaattisten kuvioiden häivyttämistä kuvalta – ei sen kummempaa – eli aineiston laatu ei parane. Oma lähtökohtani oli se, että aineisto täytyy prosessoida kunnollisesti ennen kuin siitä aletaan tehtä minkään alan tutkimuksia. Ajatelkaapa vain seuraamuksia, kun esimerkiksi ilmastonmuutostutkimusten perusteella tehdään kansainvälisiä suosituksia, vaikka itse tutkimuksen lähtöaineisto ei kestä päivänvaloa…

No, moni aineistojen käyttäjä kyllä oppii tunnistamaan ajan myötä prosessoinnin virheitä, mutta heillä on vain vähän mahdollisuuksia vaikuttaa aineistojen laadun parantamiseen. Monet käyttäjät nimittäin joko ostavat tai saavat sopimuksella käyttöönsä dataa, joka on tyypillisesti tuotettu isoihin valtiollisiin kartoitusprojekteihin. Monessa maassa tällaisten aineistojen yhteiskäyttö on näet tehty mahdolliseksi, koska sen ajatellaan yleisesti edistävän monien alojen tutkimusta ja uusien liiketoimintaidoiden syntyä. Näin myös Suomessa.

Ralfin kotimaassa Saksassa aineistot eivät ole ilmaisia, mutta Baden-Württenbergin museovirasto on saanut alueen aineiston sopimuksella käyttöönsä. Toinen esityksessä mainittu valtio Espanja puolestaan tarjoaa aineistot kaikille käyttäjille ilmaiseksi.

Kun ottaa huomioon, että aineistot tuotetaan tyypillisesti kilpailutuksella ja tekijät ovat siis kaupallisia toimijoita, voi vain edelleenkin hämmästellä kuinka heikkolaatuisia aineistoja tilaajat ottavat vastaan. Pistepilvien huonolle luokittelulle peruskäyttäjäkin voi vielä tehdä paljonkin, mutta aineistojen huonolaatuinen rekisteröinti (tuo kuvassa mainittu strip adjustment) on jo paljon vaikeampi parannettava ilman lähtöaineistoja. Suomessakin on jo pitkään keskusteltu siitä, miten huono IT-sovellusten tilaaja julkinen hallinto on, mutta mielestäni tämä pätee mihin tahansa alaan, jossa tilaaja on menettänyt ammattitaitonsa maailman vaan monimutkaistuessa.

hesse

 

Ralfilla on vielä jäljellä 30% kartoitusalueestaan, joten toivottavasti hänen aineistonsa paranevat loppua kohti. Täyden aallonmuodon aineistot jäänevät tässä vaiheessa haaveeksi, mutta tulevaisuudessa se voi olla jo standardi – kukapa tietää.

Jos joku suunnittelee lähtöä ilmalaserkeilausmarkkinoille, niin laadukkaiden aineistojen tekijöille olisi kyllä tilaa. Maksajien löytäminen on sitten toinen asia, kun halpa & huonolaatuinen data näyttää riittävän tilaajille. Sehän ei tule kalliiksi – eihän? Tutkijoiden iloksi EUn T&K-rahoja ei olla merkittävästi vähentämässä…

Vastaa