Älä lykkää analytiikkaratkaisuja

Moni organisaatio on määritellyt strategiassaan, että data on tärkeä – jopa tärkein – assetti eli pääoma, usein henkilöstön rinnalla. Tavoitteena on siis datavetoinen toiminta.

Strategisesti tärkeän asian hoitaminen ei suju vasemmalla kädellä tai ulkoistamalla, tarvitaan panostuksia.

Jotta data saadaan hallintaan, tarvitaan ainakin kahta asiaa. Ensinnäkin on hankittava yhteinen ymmärrys omasta datasta ja kuvattava se. Tähän auttaa käsitemallinnus.

Toiseksi tietojen pitää olla saatavilla ns. toissijaiseen käyttöön, eli analytiikkaan ja raportointiin. Dataa tarvitaan johtamisen tueksi, kehittämiseen, tilastointiin, tutkimukseen jne. Ratkaisuna ovat data platformit ja tietovarastot.

Konsultin työssä näkee kuitenkin usein suuria vaikeuksia ja hitautta päästä tällaiseen tilanteeseen. Miten voisi edetä jo alusta saakka nopeammin ja suunnitelmallisemmin?

Iso kuva

Isossa kuvassa meillä on ensisijaisia eli operatiivisia järjestelmiä, kuten laskutus- tai potilastietojärjestelmä. Näissä tiedot syntyvät ja niitä ylläpidetään.

Toissijaisissa järjestelmisä tietoja analysoidaan, raportoidaan ja tutkitaan. Vaikka nimitys on hiukan vähättelevä, tämä käyttö nähdään yhä tärkeämpänä datavetoisuuteen pyrittäessä.

Tyypillinen tilanne

Operatiivista toimintaa varten tarvitaan uusi tietojärjestelmä, jonka hankintaa ja käyttöönottoa varten perustetaan projekti. Työ ei ole helppoa, mutta lopulta järjestelmä on valittu ja otettu käyttöön.

Usein vasta tässä vaiheessa aletaan miettiä toissiijaista käyttöä. Johto, suunnittelijat ja monet muut tahot vaativat tietoa uudesta järjestelmästä. Miten toiminta ja tuottavuus on nyt kehittynyt uuden järjestelmän myötä?

Uusi data on saatava yhdistettyä olemassaolevaan dataan.

Musta laatikko

Tässä kohtaa tulee usein ongelmia.

Hankitun tietojärjestelmän taustalla pyörii tietokanta, jossa ko. alueen datat ovat. Perusongelma on siinä, että tuo tietokanta on musta laatikko. Emme tiedä sen sisältöä ja rakennetta tarkasti, nämä asiat ovat toimittajan hallussa. Usein rakenne on myös hyvin monimutkainen ja tekninen.

Tuosta tietokannasta ei ehkä saadakaan helposti tietoa ulos. On teknisiä haasteita tai toimittajasopimuksessa ei ole tästä mainintaa ja tulee hankaluuksia.

Lisäksi käsitemaailma ja käsitteiden väliset riippuvuudet ovat usein erilaisia. Uudessa järjestelmässä ehkä puhutaan vain nimikkeistä, kun liiketoiminta puhuu tuotteista, raaka-aineista ja valmisteista.

Raporteista ja tilastoista ei ole hyötyä, jos ei ole yksimielisyyttä siitä, mikä on asiakas, tilaus tai mitä tarkoittaa hoidettu potilas.

Itse tehty järjestelmä

Entä jos uusi järjestelmä onkin itse rakennettu? Nykyäähän monet organisaatiot rakentavat paljon omiakin sovelluksia.

Valitettavasti usein näkee, että nämäkin tietokannat ovat hyvin teknisiä ja vaikeaselkoisia. Tietokannan rakenne syntyy ohjelmoijan toimesta pala kerrallaan. Käsitemallinnusta ei tehdä. Ei ole tietokannan suunnitteluun keskittyvää henkilöä.

Lopputilanne on melko samanlainen kuin hankitussa tietojärjestelmässä.

Suosituksia

Kuten aiemmin totesin, datavetoisessa organisaatiossa on kuvaukset organisaation ei alueiden datoista – siis käsitemallit. Kun ollaan hankkimassa uutta tietojärjestelmää, tehdään siltäkin alueesta jo valmiiksi käsitemalli määrityksineen.

Toiseksi jo järjestelmän hankitaprosessissa selvitetään toimittajan kanssa, miten tiedot saadaan järjestelmästä ulos. Sekä teknisesti että sopimusmielessä.

Joskus ratkaisu on, että toimittaja rakentaa uusia rajapintoja tai poimintoja, perustuen tehdyn käsitemallin kuvaamiin tarpeisiin. Etuna tässä on, että datarakenteen muunnoksen tekee juuri se osapuoli, joka tuntee ko. järjestelmän tietokannan parhaiten.

Kun järjestelmä on valittu, tehdään sen tietokannasta tarkennettu käsitemalli, liiketoiminnan termejä ja käsitteitä käyttäen.

Aletaan saman tien suunnitella ja toteuttaa toissijaista käyttöä, eli analytiikkaa ja raportointia. Integroidaan tiedot talon muihin tietoihin. Näin saadaan uudesta järjestelmästa heti tärkeää liiketoiminnan päätöksiä tukevaa tietoa.

Kaikki tämä pätee myös, jos järjestelmä rakennetaan itse. Tietokannan suunnittelu kannattaa tällöin nähdä omana kokonaisuutenaan, joka tehdään käsitemallin kautta. Ei siis ohjelmoijan sivutyönä.

Organisoinnista

Miksi edellä mainitut suositukset jäävät usein tekemättä?

Yksi syy on, että itse järjestelmän hankintaprojekti on jo niin vaativa, ettei siihen kyetä enää liittämään toissijaisen käytön miettimistä.

Siksi tarvitaan lisävoimia. Tarvitaan tietoarkkitehtia ja data platform -osaajia avuksi. He auttavat käsitemallinnuksissa ja tietojen siirron tekinissä kysymyksissä.

Kohotetaan tiedonhallinnan kulttuuria järjestämällä koulutusta läpi organisaation, johtotason tietoiskut mukaan lukien. Hyviä aiheita ovat tietovarastointi, käsitemallinnus ja SQL.

Jos tehdään omia järjestelmiä, nähdään tietokannan suunnittelu omana tärkeänä kokonaisuutenaan, joka lähtee liiketoiminnan kanssa tehtävästä käsitemallinnuksesta.

Nämä ovat juuri niitä panostuksia, joita datavetoisuuteen pyrkivässä organisaatiossa kannattaa tehdä.

Etuja

Edellä mainituista menettelytavoista olisi paljon hyötyjä.

Käsitemallinnus jo ennen tietojärjestelmän valintaa auttaa käsitetason keskusteluissa toimittajehdokkaiden kanssa. Malli voi jopa paljastaa järjestelmäehdokkaan tietokannan rakenteen kohtalokkaita puutteita.

Toimittajakin pääsee paremmin kartalle mitä dataa ja rakenteita asiakas todella tarvitsee.

Ajoissa tehdyt rajapintaselvitykset nopeuttavat datan saamista ulos heti tietojärjestelmän käyttöönotosta alkaen. Sopimusasiat datan ulos saamiseksi hoidetaan jo tilausvaiheessa.

Raportoinnin toimiminen heti alusta asti on liiketoiminnallisesti tärkeää. Aletaan saman tien nähdä miten esimerkiksi tilaustoiminta nyt kehittyy tai miten uusi järjestelmä tukee potilaiden hoitoa, tarkkoina tilastoina.

Jatkuvat uudet raporttitilaukset operatiivisen järjestelmän toimittajalta vähenevät tai poistuvat, kun uusi data on heti saatavissa ja käytettävissä. Toimittajan rooli data-aineiston toimittajana korostuu.

Tyypillisesti pitää uuteen järjestelmään tehdä pieniä muutoksia, kuten uusia päivämääriä ja koodeja. Ei operatiivisen toiminnan vuoksi vaan tukemaan analytiikan ja raportoinnin vaatimuksia.

Kun ollaan aikaisin liikkellä, nämä muutokset saadaan nopeasti tuotantoon.

Mitä voi tehdä jälkeenpäin

Entä jos uusi tietojärjestelmä on jo tuotannossa ja aletaan vasta sitten miettiä toissijasta käyttöä?

Näissä tilanteissa usein mietitään ns reverse engineering -tyyppista tutkimista, jolla yritetään selvittää mustien laatikoiden sisältöä. Joskus tätä sanotaan data arkeologiaksi – siis jälkeenpäin selvitetään mitä joku on joskus suunnitellut.

Tähän käyttöön yritykset ovat myös alkaneet hankkia ns. Data Catalog -tuotteita. Ne pystyvät automaattisesti kokoamaan datakuvauksia eli metatietoa eri järjestelmistä.

Suuntaus on oikea, mutta ongelmana on, että tietojen merkityksiä ja käsitteiden määrityksiä ei voi tehdä automaattisesti, ne ovat ihmisten tehtäviä.

Juuri siksi on hyvä tehdä käsitemallinnusta, jossa mallinnetaan järjestelmien tietosisältöjä liiketoimintalähtöisin termien. Edistyksellisimmät organisaatiot yhdistävät Data Catalog -keräilyn ja käsitemallinnuksen.

Lopuksi

Datavetoisuuteen pyrkivien organisaatioiden kannattaa miettiä isoa kuvaa, jossa nähdään, miten data syntyy operatiivisissa järjestelmissä (ensiökäyttö) ja yhtä tärkeänä datan toisiokäyttö ei kaikenlainen analytiikka, tilastointi ja raportointi.

Kaikki tämä sujuu paljon paremmin, jos on oma organisaatioyksikkö hoitamassa data-asioita ja auttamassa esimerkiksi juuri uuden tietojärjestelmän hankkimistilanteessa.

Yhtenä tärkeänä menettelynä on liiketoimintalähtöinen käsitemallinnus. Sen avulla ”avataan” uusien järjestelmien mustat laatikot ja päästään nopeammin yhdistämään tiedot olemassa oleviin.

Toisena keinona ovat data platform ja tietovarastoratkaisut. Uuden järjestelmän tiedot kannattaa poimia mahdollisimman aikaisin mukaan yhdistettäviksi vanhoihin tietoihin. Asian hoitaminen ”joskus myöhemmin” on paljon monimutkaisempaa.

Ystävällisin terveisin,

Ari Hovi

PS. Tervetuloa supersuositulle SQL-kursseillemme myös 2022!

SQL perusteet

SQL on data-ammattilaisen perustyökalu tiedonlouhintaan. Se on myös ensimmäinen askel Data Sciencen maailmaan: SQL on tässä työtehtävässä kaikista olennaisin taito. Vuoden 2021 Data Science työpaikkailmoituksissa SQL on toiseksi kysytyin taito.
Ari Hovin ainutlaatuiset harjoitukset ja kurssiin sisältyvä SQL-kirja takaavat, että opit varmasti.

Kyseessä on Suomen Top30 yritysten vakiokurssi, jonka saat yrityskohtaisena myös isommalle porukalle. Etätoteutus sekä mahdollisuus valita kurssikieleksi englanti, mahdollistavat kansainvälisten tiimien kouluttamisen.
Lue tästä lisää kurssin sisällöstä.

Lue kurssista lisää tästä