Mitä on avoin data?
Avoimen datan määritelmä ei ole täysin vakiintunut. Euroopan dataportaalin mukaan “avoin (valtion) data viittaa julkisten elinten keräämään, tuottamaan tai maksamaan tietoon (toinen nimitys on julkisen sektorin tieto), joka on annettu vapaasti uudelleenkäytettäväksi mihin tahansa tarkoitukseen” (Euroopan dataportaali 2020). Avoimesta datasta tulee käyttökelpoista, kun se on helposti saatavana API-ohjelmointirajapinnan tai UI-käyttäjärajapinnan kautta. Avoimella datalla on usein lisenssi, joka antaa mahdollisuuden käyttää dataa, mm. yhdistää ja jakaa tietoja muille, jopa kaupallisesti. Avoimella datalla on seuraavat tunnuspiirteet:
- Data on kaikkien saatavilla avoimen rajapinnan kautta.
- Datan käyttö ei aiheuta suuria kustannuksia.
- Dataa saa hyödyntää vapaasti, myös kaupallisesti.
Datan avaamiseen liittyy monia haasteita. Lakisääteiset rajoitukset saattavat tulla vastaan. Lisäksi esiintyy erilaisia pelkoja, jotka liittyvät avoimen datan väärinkäyttöön tai avoimen datan virheisiin. Dataa ei välttämättä saada tai osata hakea oikeassa muodossa. Tietoaineistot saattavat ovat suuria, tai omistaja ei tiedä, missä ja miten data voitaisiin saattaa avoimesti saataville. (Open Knowledge Foundation 2020.)
Olemassa olevia avoimen datan palveluita
Pidämme Suomea usein avoimen datan edelläkävijänä. Hallinnollista avoimuutta mittaava Global Open Data Index (2020) sijoittaakin avoimuusasteikollaan Suomen viidenneksi maailmassa. Laki viranomaisten toiminnan julkisuudesta (1999) määrittää, että julkishallinnon tuottamat asiakirjat ovat Suomessa julkisia, ellei toisin mainita. Tämä ei ole lainkaan itsestään selvää muualla Euroopassa tai maailmassa. Lain tarkoituksena on muun muassa antaa yksilöille ja yhteisöille mahdollisuus valvoa julkisen vallan ja varojen käyttöä sekä turvata heidän oikeutensa ja etunsa.
Avoimen datan palveluita on nykyään jo runsaasti saatavilla. Ensimmäisen maininnan ansaitsee Avoindata.fi-palvelu, joka pyrkii rohkeasti siihen, että Suomen kaikki avoin data löytyisi yhdestä paikasta. Joulukuussa 2019 palvelussa oli saatavilla 1700 tietoaineistoa jaoteltuina 16 eri aihekategoriaan, jotka näkyvät kuvassa 1. (Avoindata.fi 2020.)
Kuva 1 Avoindata.fi-palvelun aihekohtaiset kategoriat (Avoindata.fi 2020)
Suomen suurimmilla kaupungeilla on kullakin oma keskitetty avoimen datan jakelukanavansa. Esimerkkinä mainittakoon Tampereen kaupungin dataportaali (2020), jossa on artikkelin kirjoitushetkellä tarjolla muhkeat 115 data-aineistoa, 14 sovellusta ja kokonaista 76 avointa rajapintaa kaupunkidataan.
Kaupunkien ja kuntien avoimen datan tarjontaa edisti merkittävästi 31.12.2017 päättynyt 6Aika-hankekokonaisuuden Avoin data ja rajapinnat -kärkihanke, jossa Helsinki, Espoo, Vantaa, Tampere, Turku ja Oulu avasivat yhdessä julkisia datojaan (6Aika 2015).
Euroopan laajuisesti mainitsemisen arvoinen on Euroopan dataportaali (2020), jossa koulutus-, kulttuuri- ja urheiludata on niputettu samaan luokkaan. Koulutuksen, kulttuurin ja urheilun alalta portaalista löytyy yli 6000 datasettiä Euroopan eri maista.
Koulutuksen avoin data
Avoimen datan hyödyntämismahdollisuudet ovat nousseet esille Euroopan aluekehittämisrahaston rahoittamassa 6Aika: Tulevaisuuden älykkäät oppimisympäristöt (2020) -hankkeessa, jossa Tampereen ammattikorkeakoulu (TAMK) on osatoteuttajana. Hankkeen tavoitteena on vahvistaa oppimiseen sekä älykkäisiin fyysisiin ja virtuaalisiin oppimisympäristöihin liittyviä palveluita, tuotteita ja teknologioita sekä kehittää yritysten liiketoimintamahdollisuuksia. Kysymys koulutuksen alan avoimen datan saatavuudesta on noussut esille erityisesti keskusteluissa yritysten kanssa. Yritykset toivovat mahdollisuutta luoda omaa liiketoimintaa koulutuksen avoimen datan ja avointen aineistojen pohjalta.
Kuka ja miten avoimeen koulutusdataan pääsee käsiksi, ja ketkä sitä voivat hyödyntää?
Suomessa julkinen sektori on hoitanut tehtävänsä avointen koulutusaineistojen ja datan julkaisijana kiitettävästi. Opetushallituksen tilastopalvelu Vipuseen on koottu suuri määrä avointa dataa kaikilta koulutusasteilta (Vipunen 2020). Ammattikorkeakoulujen ja yliopistojen toimintaan liittyvä data löytyy helposti Vipusesta. Terveyden ja hyvinvoinnin laitos (THL) julkaisee sivuillaan avointa, anonymisoitua dataa opiskelijaterveydenhuollosta sekä avoimia rajapintoja (THL Avoin data 2020).
Ammattikorkeakoulut ja yliopistot ovat luoneet myös omia avoimen koulutusdatan portaaleitaan ja sivustojaan. Tampereen korkeakouluyhteisön Avoin data -palvelusta (Avoin data 2020) löytyy runsaasti koneluettavia, maksuttomia ja vapaasti käytettäviä aineistoja muokattavaksi toiseen sovellukseen tai järjestelmään. Aineistot on tuotettu Tampereen ammattikorkeakoulussa ja Tampereen yliopistossa. Vastaavat avoimen datan palvelut löytyvät useimmista suomalaisista korkeakouluista.
Dataa syntyy runsaasti digitaalisissa oppimisympäristöissä (mm. Moodle). Se ei lähtökohtaisesti kuitenkaan ole avointa dataa edes anonymisoituna tai pseudonymisoituna. Verkko-oppimisympäristöjä koskevat samat EU:n yleisen tietosuoja-asetuksen (2016) velvoitteet kuin mitä tahansa verkkopalvelua, jonne ihmiset tunnistautuvat ja joissa henkilöiden identiteetti on tunnistettavissa. Digitaalisissa oppimisympäristöissä syntyvää lokidataa on kuitenkin mahdollista hyödyntää avoimesti, jos tietylle verkkokurssille kirjautuvilta edellytetään etukäteen kirjallinen tai digitaalisesti jälkikäteen jäljitettävissä oleva henkilökohtainen suostumus lokidatan käytöstä ja jakelusta avoimesti. Näissä tapauksissa avoin data tulee lähtökohtaisesti aina anonymisoida ennen avointa jakelua. Verkkokurssin osallistujille voidaan esimerkiksi laatia heti kurssin alkuun selväsanainen sopimusteksti kurssidatan ja kurssin lokidatan käytöstä. Vasta kun opiskelija on lukenut ja itse aktiivisesti merkinnyt sopimustekstin hyväksytyksi, aukeaa verkkokurssin sisältö. Tämä on osoittautunut toimivaksi käytännöksi.
Avoimen datan analysointi ja hyödyntäminen
Yleisesti ottaen yksittäisen raakadatan arvo kasvaa, mitä enemmän sitä jalostetaan ja yhdistetään muuhun dataan. Usein datan jalostusketjua kuvataan DIKW-pyramidilla (Data, Information, Knowledge, Wisdom), jonka periaate näkyy kuvassa 2. Siinä alimpana on raakadata, josta voidaan jalostaa analysoimalla ja yhdistämällä dataa informaatioksi. Informaatio voidaan edelleen jalostaa tiedoksi suuremmista kokonaisuuksista. Tietoa voidaan edelleen käyttää yhdistämällä kokonaisuuksia, jolloin voidaan jo puhua tulevaisuuden ennustamisesta.
Kuva 2 DIKW-pyramidi ja datan arvonmuodostus
Avoimen datan tapauksessa datan tuottajat ovat usein julkisen sektorin toimijoita. Arvoketjun ensimmäinen vaihe on datan luominen. Tiedot validoidaan ja jaetaan, esimerkiksi avoimen datan portaalin tai yksityisen yrityksen kautta, minkä jälkeen ne voidaan analysoida. Yhdistämällä eri tietojoukot luodaan uutta tietoa, joka voi johtaa uusiin tietopalveluihin tai tuotteisiin. Lopuksi näitä datapalveluita ja tuotteita voidaan edelleen yhdistellä loppukäyttäjän erilaisiin tarpeisiin. Avoimen datan arvoketjussa tarvitaan usein julkisen sektorin lisäksi yksityisen sektorin yrityksiä, jotka pystyvät jalostamaan dataa ja tietoa liiketoiminnaksi. Tämä prosessi esitetään kuvassa 3.
Kuva 3 Avoimen datan arvoketju (Euroopan dataportaali 2020)
Avoimen datan lisääntyessä sen hyödyntämisessä on kasvavat liiketoimintamahdollisuudet. Avoimen datan markkinankoon odotetaan kasvavan 36,9 % vuodesta 2016 vuoteen 2020, jolloin sen arvo on 75,7 miljardia euroa. Ennustettujen avoimeen dataan pohjautuvien työpaikkojen odotetaan nousevan 75 000: sta (vuonna 2016) lähes 100 000:een työpaikkaan vuoteen 2020 mennessä. Yksityisen sektorin ja julkisen sektorin odotetaan saavan kustannussäästöjä avoimen datan uudelleenkäytön kautta yhteensä 1,7 miljardia euroa euroalueella vuoteen 2020 mennessä. (Euroopan dataportaali 2020.)
Oppimiseen, koulutukseen ja oppimisympäristöihin liittyvää dataa syntyy paljon erilaisista lähteistä, mutta datan liiketoimintamahdollisuuksista on hyvin vähän tietoa saatavilla. Dataa syntyy mm. opetustilojen käyttöasteesta, ympäristöolosuhteista, viihtyvyydestä, työsuorituksista, oppimistuloksista, ryhmäkoista, digitaalisten oppimisympäristöjen lokeista, opetusmateriaaleista ja -menetelmistä. Liiketoimintamahdollisuuksiin vaikuttaa oleellisesti se, miten helposti data saadaan julkisesti saataville avoimena datana. Tähän voidaan käyttää olemassa olevia dataportaaleja. Oppimisympäristöjen avointa dataa voisi hyödyntää mm. tilojen käyttöasteen optimoinnissa, energian säästämisessä, oppimisympäristöjen kehittämisessä, opiskelijoiden motivoinnissa, opetusmateriaalien kehittämisessä, oppimispolkujen kehittämisessä ja uusien palveluiden kehittämisessä.
Johtopäätöksiä avoimen datan käytöstä koulutuksessa
Tässä artikkelissa on pohdittu, olisiko koulutuksen alalle mahdollista ja järkevää luoda jonkinlainen oma avoimen datan palvelu. Kysymys on noussut esiin keskusteluissa etenkin yritysten kanssa. Tämän hetken tiedon valossa voidaan todeta, että koska olemassa olevia avoimen datan lähteitä ja portaaleja on jo runsaasti olemassa, uutta datapalvelua tähän tarkoitukseen ei kannata perustaa. Uusi koulutuksen käyttöön dedikoitu portaali vain pirstaloisi avoimen datan saatavuutta. Sen sijaan Digi- ja väestötietoviraston ylläpitämää kansallista avoindata.fi-palvelua kannattaisi vahvistaa ja kehittää eteenpäin, jotta yritykset ja muut toimijat löytäisivät sieltä keskitetysti myös koulutusaiheisen datan. Esimerkiksi Opetushallinon tilastopalvelu Vipunen.fi kannattaisi linkittää myös avoindata.fi-palvelun yhteyteen. Palvelun jatkuva ylläpito on tärkeää, jotta kaikki olemassa olevat ja myös uudet avoimen datan lähteet löytyvät yhteisestä dataportaalista.
Lähteet
6Aika. 2015. Tuloksia: Avoin data ja rajapinnat. Luettu 9.3.2020. https://6aika.fi/avoin-data-ja-rajapinnat-karkihanke/
6Aika: Tulevaisuuden älykkäät oppimisympäristöt. 2020. Luettu 9.3.2020. https://www.oppimisenuusiaika.fi/
Avoin data. 2020. Tampereen korkeakouluyhteisön avoimen datan palvelu. Luettu 9.3.2020. https://avoindata.tuni.fi/
Avoindata.fi. 2020. Suomen kaikki avoin data yhdestä paikasta. Luettu 9.3.2020. https://www.avoindata.fi/fi
Euroopan dataportaali. 2020. Luettu 9.3.2020. https://www.europeandataportal.eu/fi
Global Open Data Index. 2020. Place overview. Open Knowledge Foundation. Luettu 9.3.2020. https://index.okfn.org/place/
Laki viranomaisten toiminnan julkisuudesta 21.5.1999/621. Luettu 9.3.2020. https://www.finlex.fi/fi/laki/ajantasa/1999/19990621
Open knowledge foundation. 2020. Luettu 9.3.2020. https://okfn.org/
Tampereen kaupungin dataportaali. 2020. Luettu 9.3.2020. https://data.tampere.fi/fi/
THL Avoin data. 2020. Luettu 9.3.2020. https://thl.fi/fi/tilastot-ja-data/aineistot-ja-palvelut/avoin-data#Opiskeluterveydenhuolto
Vipunen. 2020. Opetushallinnon tilastopalvelu. Luettu 9.3.2020. https://vipunen.fi/fi-fi
Kirjoittajat
Sampo Saari, fysiikan lehtori, TkT, Pedagogiset ratkaisut, TAMK, sampo.saari@tuni.fi
Teija Lehto, erikoissuunnittelija, FM, Koulutuksen kehittämispalvelut, TAMK, teija.lehto@tuni.fi
Kuvituskuva: Unsplash/Jordan Harrison
Kommentit