Ennusteita datan avulla
Oppimisanalytiikka on opiskelijoiden erilaisissa oppimistilanteissa tuottaman datan mittaamista, keräämistä, analysointia ja raportointia (Call for Papers, 2011; Suhonen & Kinnari-Korpela, 2017). Oppimisanalytiikan avulla on mahdollista mm. kehittää opetusta, ohjausta, oppimisympäristöjä ja materiaaleja ts. tukea, kehittää ja optimoida oppimista (Suhonen & Kinnari-Korpela, 2017). Vaikka oppimisanalytiikan käyttö ja hyödyntäminen ovat viime vuosina lisääntyneet erityisesti korkeakoulutuksen parissa, automatisoidun analytiikan hyödyntämisessä on vielä paljon kehitettävää.
Oppilaitoksissa opiskelijan erilaisista oppimiseen liittyvistä prosesseista kerätään dataa, jota voidaan analysoida mm. koulutuksen tarpeisiin. Vaikka oppimisanalytiikan määritelmä ei rajaa analytiikkaa vain digitaalisesti saatavilla olevaan dataan, käytännössä helpoin tapa hyödyntää dataa on kerätä se oppimistilanteista digitaalisesti ja automaattisesti. Aiemmissa tutkimuksissa on hyödynnetty muun datan ohella digitaalisten oppimisympäristöjen, esimerkiksi Moodlen, dataa ennustettaessa opiskelijan menestystä opinnoissa (Al-Shabandar ym., 2018; Kabakchieva, 2013; Ortiz-Lozano ym., 2020). Digitaalisten oppimisympäristöjen datasta on hyödynnetty lokidataa, kuten esimerkiksi opiskelijan sisäänkirjautumista, materiaalien avaamista ja videoiden katselukertoja yms. Oppimisympäristön datan perusteella opiskelijan menestystä opinnoissa on ennustettu muun muassa opiskelijan oppimiskäytöksen perusteella. Käytännössä on esimerkiksi tarkasteltu, miten aktiivista opiskelijan opiskelu on ja kuinka paljon hän on käyttänyt aikaa oppimisympäristössä.
Aktiivisuusdatan analysointi ja keskeyttämisvaarassa olevat opiskelijat
TAMKin tekniikan alan koulutuksissa on tehty tutkimusta opintojen keskeytyksistä vuosina 2018–2020. Tutkimuksessa pyrittiin löytämään Moodlen aktiivisuusdatasta tunnuspiirteitä.
Moodlen aktiivisuusdatan perusteella analysoitiin keskeyttämisvaarassa olevia opiskelijoita ja tarkasteltiin, löytyykö opiskelijan Moodlen opiskeluaktiivisuuden ja opintojen keskeyttämisen välitä korrelaatio. Tutkimuksessa käytettiin eri tutkinto-ohjelmien ja eri vuosikurssien opiskelijoiden Moodlen lokidataa useilta opintojaksoilta ja tunnistettiin datasta piirteitä, jotka ennustavat mahdollista opintojen keskeyttämistä. Tutkimus tehtiin takautuvasti siten, että tutkintovastaava tiesi jo tutkittaessa, ketkä opiskelijat olivat opintonsa keskeyttäneet. Tässä artikkelissa esitellään toimintatapaa tietotekniikan tutkinto-ohjelman osalta.
Tutkimusta varten Moodlen lokidataa kerättiin tiettyjen vuosikurssien useilta opintojaksoilta. Lokidata pseudonymisoitiin ja ladattiin Exceliin siten, että vain tutkintovastaava tiesi opiskelijoiden henkilöllisyydet. Muut tutkimuksen toteuttajat eivät käsitelleet sellaista dataa, josta opiskelijoiden henkilöllisyydet olisivat käyneet ilmi.
Tutkimuksessa pyrittiin löytämään Moodlen aktiivisuusdatasta tunnuspiirteitä.
Kunkin opiskelijan lokitapahtumien kokonaismäärät laskettiin Excelissä viikkokohtaisesti. Koska opiskelijat päättävät silloin tällöin pitää ”omaa lomaa” tai ovat muuten estyneitä opiskelemaan, tulkintoja ei tehty yksittäisen viikon aktiivisuuden perusteella, vaan tarkastelussa käytettiin opiskelijan aktiivisuuden kolmen viikon liukuvaa keskiarvoa (kuva 1). Mikäli tämä keskiarvo laski nollaan, Excelin laskenta antoi keskeyttämisvaarahälytyksen (kuva 2).
Kuva 1 Kolmen viikon liukuvalla keskiarvolla lasketut opiskelijoiden (ID1-ID6) aktiivisuudet.
Kuva 2 Aktiivisuushälytys kolmen viikon liukuvalla keskiarvolla
Aktiivisuustarkastelun jälkeen tutkintovastaava tarkasti niiden opiskelijoiden opiskelutiedot, joista Excelin laskenta oli antanut keskeyttämisvaarahälytyksen. Koska tutkimus tehtiin jo päättyneiden opintojaksojen datalla, pystyi tutkintovastaava selvittämään, olivatko kyseiset opiskelijat tosiasiallisesti olleet keskeyttämisvaarassa vai eivät. Tietotekniikan opiskelijoiden joukosta saatiin seuraavat tulokset:
- Opiskelee normaalisti: 53 %
- Keskeyttämisvaarahälytys: 47 %
- keskeyttänyt: 21 %
- opiskelutahti hidas: 13 %
- siirto-opiskelija: 11 %
- väärä hälytys: 2 %
Tulosten perusteella Moodlen lokidatan avulla on mahdollista löytää kaikki normaalista opiskelutahdista poikkeavat tilanteet. Merkille pantavaa on, että kukaan opiskelunsa keskeyttänyt ei jäänyt Moodle-datan tuottaman hälytyksen ulkopuolelle. Täten hälytyksen kattavuus tässä tarkastelussa oli 100 %.
Kohti tehokkaampaa ohjausta
Keskeyttämisvaarassa olevia opiskelijoita on tällä hetkellä haastava tunnistaa. Ilman Moodle-datan käyttöä, opiskelijan opiskeluvaikeudet eivät välttämättä tule näkyviin eikä tarvittavia ohjaustoimenpiteitä osata kohdistaa oikeaan aikaan oikeille opiskelijoille. Nykyisin Peppi-järjestelmä ei tuota automaattista ilmoitusta opintojen keskeyttämisestä. Esimerkiksi TAMKissa tutkinto-ohjelmien tutkintovastaavan täytyy itse käydä katsomassa ryhmiensä tiedot. Opiskelijan opintojen keskeyttäminen voi tulla hänen tietoonsa vasta ilmoittautumisen laiminlyönnin tai eroilmoituksen jälkeen.
Tämän tutkimuksen avulla haluttiin selvittää, onko Moodlen lokitietojen perusteella mahdollista tunnistaa hyvissä ajoin ne opiskelijat, jotka ovat vaarassa keskeyttää opintonsa. Tutkimuksessa tätä selvitettiin vertaamalla Moodlen lokidatan tuottaman hälytyksen ajankohtaa ja Pepissä näkyvää virallista eroamisen ajankohtaa. Havaittiin, että tietotekniikan keskeyttäneiden opiskelijoiden opiskeluaktiivisuuden lasku näkyi Moodlessa jopa 19 kuukautta aiemmin kuin se muutoin tuli näkyviin. Keskimäärinkin tämä viive oli 12 kuukautta. Tutkimuksen perusteella Moodle-aktiivisuutta voitaisiin käyttää apuna keskeyttämisvaarassa olevien opiskelijoiden löytämisessä. Tällöin heille voitaisiin tarjota tukea opintoihin paljon aikaisemmin kuin tällä hetkellä, ja tukitoimet voitaisiin tarjota paremmin kohdennetulle joukolle kuin tällä hetkellä tehdään.
Lähteet
Al-Shabandar, R., Hussain, A. J., Liatsis, P. & Keight, R. 2018. Analyzing Learners Behavior in MOOCs: An Examination of Performance and Motivation Using a Data-Driven Approach. IEEE Access, 6, 73669-73685.
Call for Papers. 2011. 1st International Conference on Learning Analytics and Knowledge. Luettu 23.11.2020. https://tekri.athabascau.ca/analytics/call-papers.
Kabakchieva, D. 2013. Predicting student performance by using data mining methods for classification. Cybernetics and information technologies, 13(1), 61-72.
Ortiz-Lozano, J. M., Rua-Vieites, A., Bilbao-Calabuig, P. & Casadesús-Fa, M. 2020. University student retention: Best time and data to identify undergraduate students at risk of dropout. Innovations in Education and Teaching International, 57(1), 74-85.
Suhonen, S. & Kinnari-Korpela, H. 2017. Oppimisanalytiikka opetuksen ja oppimisen tukena. TAMKjournal 29.8.2017. Luettu 23.11.2020. https://sites.tuni.fi/tamk-julkaisut/oppimisanalytiikka-opetuksen-ja-oppimisen-tukena/
Kirjoittajat
Hanna Kinnari-Korpela
Tutkintovastaava, Tietotekniikan tutkinto-ohjelma
Teollisuusteknologia-yksikkö, TAMK
hanna.kinnari-korpela@tuni.fi
Asiantuntijuusalueet: tekniikan koulutus, insinöörimatematiikka, STEM-aineiden pedagogiikka, oppimisen itsesäätely, digityökalut opetuksessa, oppimisanalytiikka
Sami Suhonen
Yliopettaja, digimentori
Matematiikan ja fysiikan tiimi, Pedagogiset ratkaisut -yksikkö, TAMK
sami.suhonen@tuni.fi
Asiantuntijuusalueet: tekniikan koulutus, insinöörifysiikka, STEM-aineiden pedagogiikka, digityökalut opetuksessa, oppimisanalytiikka
Kuvituskuva: TAMK/Viestintä
Kommentit