Data science ja koneoppiminen modernisoivat Tilastokeskuksen datakäsittelyä

Tilastokeskuksen projektipäällikkö Jussi Ritola on muun muassa data sciencen ja koneoppimisen asiantuntija, joka kehittää tilastotuotannon tehostamiseen tähtääviä työkaluja. Ritola kuvailee työtään monien asioiden yhdistelmäksi, jossa parasta on uusista menetelmistä ja teknologioista oppiminen.

Tietotehtaalla töissä

Tilastokeskus on valtion tietotehdas. Sen toiminta pyörii datan ympärillä. ”Tilastokeskus hankkii mittavia määriä erilaista dataa ja tilastoja, ja tekee niistä määrämuotoisia koosteita tai tutkimusaineistoja. Meidän lopputuotteitamme ovat nämä koosteet ja aineistot, jotka ovat hyvin dokumentoituja ja ilmestyvät ennalta määriteltyjen aikataulujen mukaan”, kertoo Tilastokeskuksen projektipäällikkö Jussi Ritola. Ritola on työskennellyt Tilastokeskuksella erilaisissa tehtävissä jo 10 vuotta. Vuodesta 2012 hän on toiminut projektipäällikkönä.

Viimeisen vuoden aikana Ritolan työ on ollut teknisempää kuin aiemmin. Ritola kertoo, että hän on vastannut dataosaamiseen ja -kehittämiseen liittyvien työkalujen käyttöönotosta, sekä tehnyt niiden toteutuksia. ”Nimellisesti olen projektipäällikkö, mutta käytännössä vastaan tällä hetkellä data science- ja koneoppimistekemisestä ja niihin liittyvien teknologioiden käytön edistämisestä”, Ritola kuvailee omaa työtänsä. ”On ollut kiva olla tekemässä vaihteeksi erilaisempaa hommaa”, hän sanoo.

Uudenlaista datatekemistä

Data sciencea Ritola kuvailee monitulkintaiseksi termiksi, jolla voidaan tarkoittaa montaa asiaa. Tilastokeskuksen kontekstissa se tarkoittaa tällä hetkellä uudenlaisten aineistojen ja käsittelymenetelmien käyttöönottoa. Nämä aineistot voivat tulla joko yksityiseltä tai julkiselta sektorilta ja niitä yhdistää usein massiivinen koko sekä tiheä päivittyvyys. ”Näiden uudentyyppisten aineistojen käsittely on arkipäivää etenkin yrityspuolella, mutta Tilastokeskuksella vielä melko uutta”, Ritola kertoo.

”Meidän kontekstissamme data science tarkoittaa datakäsittelyn modernisointia, eli uusia menetelmiä, välineitä ja lähteitä”, Ritola kertoo.  


”Organisaatiouudistus on ollut vahvassa osassa viimeisen vuoden aikana.



Viimeisen vuoden Ritolan työtä on vahvasti määrittänyt myös Tilastokeskuksen organisaatiouudistus. Organisaatiouudistuksen myötä Tilastokeskuksen toimintaa halutaan järjestellä enemmän tiedon äärelle. Tarkoituksena on tuottaa suurta tietovarantoa yksittäisten tilastojen sijaan. Uudistus on luonnollisesti vaikuttanut myös Ritolan töihin. ”Se on ollut vahvassa osassa viimeisen vuoden aikana. Uudistusta on tehty hartaasti ja nyt se alkaa hiljalleen realisoitumaan”, Ritola kuvailee. 

Organisaatiouudistuksen aikana Ritola on ollut myötävaikuttamassa siihen, miten Tilastokeskuksen uudenlainen datatekeminen organisoidaan ja millaisia välineitä siihen tarvitaan. ”Tavoitteena on pystyttää jonkinlainen data science -toiminto tai -tiimi meidän Kehittäminen- ja digitalisaatio -palvelualueellemme”, Ritola kertoo.

Koneoppimisella uudistetaan tuotantoprosessien vaiheita

Koneoppiminen on yksi keskeinen osa data science -työkalupakkia. Koneoppimisella tarkoitetaan algoritmeja, joiden avulla voidaan tehdä dataan perustuvia automaattisia tai puoliautomaattisia toimenpiteitä, ilman eksplisiittistä sääntöjen ohjelmointia. ”Algoritmit pystyvät lisää dataa saadessaan toimimaan paremmin ja optimoimaan itseään. Koneoppiminen on myös useimpien ns. tekoälyratkaisujen taustalla”, Ritola kertoo. 

Tilastokeskuksella tämä tarkoittaa konkreettisemmin sitä, että voidaan korvata erilaisia tuotantoprosessien vaiheita automatisoimalla ja modernisoimalla tuotantoa. Tavoitteena on tilastotuotannon tehostaminen ja nopeuttaminen, sekä uusien tietotuotteiden tuotannon mahdollistaminen. Automatisaatiolla ihmistyötä saadaan ohjattua manuaalisista tehtävistä paremmin arvoa tuottaviin tehtäviin.  

Monipuolisuus määrittävänä tekijänä

Työtaivaltaan Tilastokeskuksella Ritola kuvailee monipuoliseksi. ”Meillä pääsee tekemään monipuolisesti erilaisia asioita, etenkin jos hyödyntää talon sisäisiä liikkuvuusmahdollisuuksia”, Ritola kertoo. Tilastokeskuksella Ritola ei ole organisaation nimestä huolimatta koskaan tehnyt varsinaisia tilastoja. ”En ole koskaan ollut tuotantovastuussa tilastoista. Toki olen tehnyt töitä niiden parissa. Työni on kuitenkin suurimmaksi osaksi keskittynyt kehittämispuolelle”, hän toteaa.


”Meillä pääsee tekemään monipuolisesti erilaisia asioita”


Se, mitä Ritolan työssä pääsee konkreettisesti tekemään, on esimerkiksi tuotantoprosessien analysointi yhdessä asiantuntijoiden kanssa – vaikkapa automatisaation mahdollisuuksien tunnistamiseksi. Ritola listaa tehtäviinsä myös dataratkaisujen koodaamisen, uudenlaisiin datan lähteisiin liittyvien haasteiden ratkaisun sekä uudenlaisten toimintatapojen edistämisen. ”Pilvimaailma tuo tähän oman lisänsä. Siihen liittyen pääsee esimerkiksi miettimään, tietoturvaa, miten alustoja pystytetään ja millaisista palikoista dataratkaisuja kootaan”, Ritola valottaa. Työtään Ritola kuvaileekin monien asioiden yhdistelmäksi. 

Kehityksen edistymistä havainnoimassa

”Uusista menetelmistä ja teknologioista oppiminen ja niiden tutkiminen ja käyttöönotto on erityisen lähellä sydäntäni tällä hetkellä”, Ritola kertoo. ”Erityisen kiinnostavaa on ollut viedä meidän sovelluskehitystämme yhä enemmän pilviympäristöön. On ollut kiva olla mukana tekemässä sitä matkaa.”, hän jatkaa. Kehityksen tarkoituksena on mahdollistaa ketterämpää kehittämistä. Ritola on ollut myös osa niin sanottua pilvitiimiä. Se on poikkihallinnollinen osaamiskeskittymä, jonka tehtäviin kuuluu pilviympäristöteeman kanssa työskentely. ”Se on ollut tosi kiinnostava juttu. Siellä tuntee olevansa kehityksen kärjessä siinä mielessä, että näkee mihin ollaan menossa, ja voi jopa vaikuttaa suuntaan”, Ritola sanoo.

Jussi Ritola ilmoitettiin sivustolle Ilmianna kiinnostava virkamies -kampanjan kautta. Konseptiin kuuluu ilmiantaa seuraava haastateltava virkamies. Jussi ilmiantaa seuraavaksi haastateltavaksi Juuli Bromsin, joka työskentelee Kilpailu- ja kuluttajavirastossa tutkimuspäällikkönä.