Verokuitti Ja Sen Laskentaperusteet
Vuonna 2011 tein yhdessä parin kaverin kanssa harrasteprojektina Verokuitti-palvelun, jossa käyttäjä kykeni tutkimaan valtion budjettia syöttämällä vuositulonsa ja sivu visualisoi valtion menojen osuuden tälle käyttäjälle kauppakuitin muodossa.
Palvelu voitti 2011 Apps4Finland-gaalassa Helsingin Sanomien erikoispalkinnon vuoden parhaasta tietojournalismista. Seuraavana vuonna se oli ehdolla Googlen tukemassa kansainvälisessä Data Journalism Awards -kilpailussa. Palvelu kirvoitti jopa kirjallisen kysymyksen Eduskunnassa vuonna 2019 miksi valtio ei tarjoa vastaavaa palvelua, etenkin kun alkuperäistä Verokuittia ei oltu päivitetty enää 5 vuoteen.
Aika ajoin olemme saaneet viestejä palvelun herättämisestä henkiin ja niin kävi taas kerran kun edellä mainitun kirjallisen kysymyksen tehnyt ja Verokuitin vankka fani Satu Hassi kyseli taas palvelun perään Facebookissa ja löysi Blueskyn kautta tiensä luokseni. Sydäntä kyllä lämmittää kuinka tämä projekti on säilynyt ihmisten mielessä jo kohta 15 vuotta. Hassi on tänä aikana useamman kertaa kuuluttanut tämän perään ja Hassikin oli joskus kauan sitten ollut meihin yhteydessä. On sääli ettei mikään ”oikea” tahoa ole ottanut palvelusta koppia.
Vaikka Verokuitti olikin tehty avoimen datan hypevuosina, se ei kuitenkaan koskaan ollut avointa koodia. Nyt tämä asia korjaantuu jonkin verran, sillä avasin hiljattain GitHubissa miten Verokuitti toimi koodin ja datan tasolla vielä n. vuonna 2013 ja miten vastaavan laskelman voisi kenties toteuttaa tänä päivänä ja mitä haasteita siihen liittyy.
Alkuperäinen Verokuitti toimi (ja toimii edelleen) PHP:llä ja sen datan analysointi oli tehty kaikista maailman kielistä Rubyllä. Koska en juurikaan käytä kumpaakaan[1] kieltä nykyään, on tämä analyysi sen sijaan tehty tilastojen ja datan näpertelyyn sopivammalla R:llä. Hain motivaatiota yli 10 vuotta vanhan koodin setvimiseen Quarton, rvest:in ja gt:n oppimisen kautta.
Ja näistä etenkin PHP on aivan ero peto tänä päivänä kuin mitä se oli 15 vuotta sitten, vaikka sitä eittämättä voi käyttää yhtä villisti kuin vuosituhannen alussa. ↩︎