12.10.2018

Älä lähde dataprojekteihin teknologia edellä

Hei,

Olemme aloittaneet hiljattain aloittaneet uuden Ellie -sovelluksemme hyödyntämisen asiakkaidemme kanssa.

Kysyntä palvelullemme on nyt kovaa ja saamme  paljon yhteydenottoja. Meillä ei ole mahdollisuuksia toteuttaa nyt ihan kaikkia hankkeita, mutta otamme vielä mielenkiintoisia projekteja työn alle, eli edelleen voi olla yhteydessä.

Mikä on siis se ongelma, jonka ratkaisemiseksi Ellie on kehitetty? Miten se ratkaisee tämän ongelman?

Ongelma liittyy kommunikaatioon. Liiketoiminta ja IT-henkilöt eivät puhu samaa kieltä, eivät ymmärrä toisiaan. IT-puolella puhutaan liikaa teknologiaratkaisuista ja rakennetaan datajärjestelmiä, jotka eivät palvele liiketoiminnan tarpeita

Ongelma on lyhyesti se, että yritykset haluavat hyödyntää dataa, mutta liiketoiminta ei täysin ymmärrä mistä on kyse. Toisaalta taas IT- kehittäjät ja Data Scientistit eivät luonnollisestikaan ymmärrä liiketoimintaa niin hyvin, että tietäisivät mitä sen kehittämiseksi pitäisi tehdä.

Keskeinen haaste datan ja tekoälyn hyödyntämisessä on, että IT-ihmiset kehittävät data-asioita keskenään, ilman että liiketoiminta on mukana. En tunne kovin montaa tapausta, jossa organisaatio olisi saanut datasta tai tekoälystä mittavaa hyötyä ilman liiketoiminnan mukanaoloa.

Uskomme, että käsitteiden liiketoimintalähtöinen mallinnus on hyvä tapa kommunikoida liiketoiminnan ja IT:n välillä. Mallinnuksen helpottamiseksi ja nopeuttamiseksi olemme kehittäneet Hovi Data Frameworkin ja nyt Ellien sen digitaaliseksi tueksi.

Haluan myös omalta osaltani vaikuttaa käytäntöihin ja periaatteisiin, joilla dataprojekteja tehdään. Olen tutkinut asiaa pitkään ja yritysten ja erehdysten kautta löytänyt mielestäni parhaan toimintatavan. Kerron tässä siitä lisää.

Tärkeää on miettiä dataprojektien marssijärjestystä ja miten Ellie tukee tätä.

Määrittele liiketoimintaongelma

Kaikki lähtee tyypillisesti tietyn liiketoimintaongelma ratkaisusta datan avulla. Tarvitaan jotain tietoa liiketoiminnan tilasta tai on dataan perustuva kehitysprojekti meneillään, liittyen esimerkiksi raportoinnin, analytiikan tai tekoälyn kehittämiseen.

Jos liiketoiminta saa itse tiedot helposti käsiinsä, niin asiat ovat hyvin. Jos eivät saa ja ongelma toistuu, niin liiketoiminta antaa käskyn IT:lle että asialle pitäisi tehdä jotain.

Pahin tilanne on se, että halutaan vain teknistä ratkaisua, kuten tekoälyä, tietovarastoa, data-allasta, Azureja, AWS:ää tms ilman kunnollista liiketoimintasyytä, niiden itsensä vuoksi.

Ne eivät ole itseisarvoja, tavoitteenahan on kehittää tai optimoida liiketoimintaa. Tämä on tärkeää erityisesti alussa ja silloin, kun ei vielä oikein hahmoteta datakeskeistä ajattelua. Palaan siihen kohta.

Oikean liiketoiminnallisen tarpeen tunnistamisen jälkeen tullaan kriittiseen vaiheeseen: miten asiaa lähdetään purkamaan. Vieläkään ei kannata miettiä uusien teknologioiden ja IT-järjestelmien hankkimista.

Mennään siis vikaan, jos ajatellaan tarkemmin miettimättä, että tämä on teknologiahaaste.

Selvitä ensin, että mikä nykyisissä systeemeissä mättää ja koita ratkaista haaste aluksi olemassa olevilla välineillä. Jos kuitenkin todetaan, että nykyiset systeemit eivät riitä, niin sitten on vaiheessa niiden kehittäminen tai uusien hankkiminen.

Nyt kannattaa olla tarkkana. Usein tässä vaiheessa projekti ulkoistetaan kokonaan sisäisen IT:n ja ulkoisten konsulttien vastuulle. Tässä vaiheessa niin ei kannata tehdä – ulkoistuksen aika tulee myöhemmin.

Miksi hanketta pitää vetää liiketoimintavetoisesti?  Eikö meidän data scientisti, devaaja, IT-väki, toimittaja, data-analyytikko voi vain hoitaa tätä kuntoon? Miksi minua, johtajaa, vaivataan tällä asialla, vaikka minulla on liiketoiminta johdettavana?

Juuri siksi, että ratkomme sinun ongelmaa, hyvä liiketoiminnan edustaja. Ja koska kukaan muu ei tiedä liiketoiminnan puolesta mitä tarkoitetaan vaikkapa asiakkaalla tai tuotteella ja miten ne liittyvät toisiinsa. IT ja dataosaajat eivät myöskään aina tunne kaikkia IT-järjestelmiä osatakseen kaivaa oikeaa dataa.

Nyt käy usein niin, että edelleen liiketoiminta haluaa ulkoistaa projektin muiden tehtäväksi.

Tässä vaiheessa suosittelen perusasioiden läpikäymistä liiketoiminnan kanssa ja avata datakeskeisen ajattelun periaatteita.

Mitä on data ja sen hyödyntäminen?

Datakeskeinen ajattelu

Lähdetään siitä, että liiketoiminnan on hyvä tietää tietyt perusasiat, kun lähdemme mihin  tahansa datan hyödyntämiseen liittyvään operaatioon.

Yrityksillä ja organisaatioilla voi olla kymmeniä tai jopa satoja IT-järjestelmiä käytössä. Dataa yrityksillä on myös tiedostoissa, kuten Exceleissä ja muissa office-dokumenteissa. Sitten on vielä Big Data, joka sekin on usein tallennettuna jossain.

Nämä kaikki muodostavat organisaation datavarannon, joka on todella arvokas, koska siellä on lähes kaikki tieto liiketoiminnasta.

Toisaalta nämä lukuisat järjestelmät muodostavat todella massiivisen ryteikön, josta on vaikeaa muodostaa kokonaiskäsitystä. Yrityksen johdolle tulee yleensä hieman yllätyksenä asian monimutkaisuus.

Ei aina tiedosteta, että tiedot ovat siellä järjestelmissä sirpaloituneena, usein vielä moneen kertaan ja kukaan ei hallitse kokonaisuutta.

Jos yrittää kuvata tätä sekasotkua arkkitehtuurikaavioon, niistä tulee usein niin monimutkaisia etteivät ne aukene liiketoiminnalle. Jos näytät sellaista johdolle, he alkavat vilkuilla kännykkää ja vetäytyä vähin äänin paikalta.

Nyt myös johtajat ovat sitä mieltä, että tekoälyä tulisi hyödyntää enemmän. Heille voi sanoa, että tekoälyhaasteon lähes aina datahaaste. Toimiakseen tekoäly ja koneoppiminen tarvitsevat oikeanlaista dataa.

Tiivistän vielä perusajatukset, kolmeen faktaan:

  • lliiketoimintaa voi ja pitää kehittää datan ja tekoälyn avulla

  • datat ovat tällä hetkellä piilossa

  • datan ja tekoälyn hyödyntäminen ilman liiketoiminnan vahvaa mukanaoloa ei onnistu.

Tämä on kaiken pohja. Kaikki projektit liiketoiminnan kanssa kannattaa aloittaa näiden asioiden kertaamisella. Kerron seuraavaksi hieman keinoista, joiden avulla saamme liiketoiminnan sitoutettua.

Miten motivoida liiketoiminta mukaan hankkeeseen?

Yritykset on organisoitu kukin omalla tavallaan, eikä ulkopuolisilla yleensä ole siihen sanan sijaa. Jos liiketoiminta ei ymmärrä datan merkitystä eikä halua olla mukana, niin sille ei voi mitään.

Seuraavassa on kuitenkin keinoja ja toimintatapoja, jotka voivat auttaa liiketoiminnan saamiseksi mukaan projektiin.

Käsitemallinnuksen avulla voimme rakentaa näkymän koko datavarantoihin yhdessä liiketoiminnan kanssa siten, että käytetään vain liiketoiminnalle tuttuja käsitteitä ja määritellään niiden väliset yhteydet ja riippuvuudet.

Kun yhdistämme näkymiä, alamme saada käsityksen kokonaisuudesta ymmärtäen, että missä järjestelmässä mitkäkin data sijaitsevat ja miten niihin pääsee käsiksi. Tässä työssä olemme menestyksellä käyttäneet Ellietä.

Alunperin käsitemallinnus ei useinkaan ole tuttua liiketoiminnalle. Mutta äskettäin meillä oli mallinnusistunto liiketoiminnan kanssa, jossa käytimme Ellietä.  He suorastaan innostuivat! Tilaisuudessa puhuttiin vain liiketoiminnan kieltä, eli lainkaan tekniikkaa tai IT-jargonia.

Lopputuloksena siisti, ymmärrettävä datakartta keskeisistä käsitteistä. Sen he halusivat heti saada haltuunsa, kommenttina että aivan sama miksi tätä kutsutaan, tätä pitää saada lisää. Tärkeintä kuitenkin oli ymmärryksen lisääntyminen datakeskeiseen ajatteluun.

Miten datakartta sitten rakennetaan?

Voimme lähteä liiketoimintahaasteesta liikkeelle, esimerkiksi moni teollisuusyritys haluaa siirtyä kysyntävetoiseen tuotatoon. Nyt asiakkaat tilaavat tuotteita tarpeen mukaan, jotka toimitetaan tilauksen jälkeen perille. Voisimme kuitenkin analysoida kysynnän koneellisesti ja ennakoida tulevaa kysyntää.

Ellien avulla selvitämme hyvin nopeasti, että mitä dataa tarvitsemme tämän toteuttamiseen, missä data ovat ja pääsemme töihin. Meillä on käsissämme suunnitelma ja loppu on kiinni toteutuksesta.

Tämä on osoittautunut erinomaiseksi tavaksi saada liiketoiminta mukaan talkoisiin. Elliessä liiketoiminta näkee datavarantonsa visuaalisen graafin avulla. Sieltä voidaan poimia ne liiketoiminta-alueet, joita halutaan kehittää tai voidaan lähteä rakentamaan analytiikkaa tietovarastoineen tai vaikkapa masterdataprojekti.

Mallien lisäksi Ellieen katalogiin talletetaan keskitetysti käsitteiden määritelmät, esimerkkijä, synonyymejä, attribuutteja yms. metadataa (metadataosio voidaa räätälöidä tarpeen mukaan).  Elliestä voidaan aina näyttää missä mennään ja lähteä laajentamaan. Näin saadaan liiketoiminnan näkemykset heijastumaan toteutukseen saakka. Vuorovaikutus jatkuu.

Dataprojektin toteutuksen määritys

Nyt meillä on liiketoiminta mukana ja ongelma käännetty ”datan kielelle” Ellien avulla. Jos tarvitsemme uuden tietovaraston tai lähdemme tekemään tekoälyhanketta, Ellien malli toimii pohjana.

Käytä mallia kommunikointiin toteuttajan kanssa, olisi se sitten tekoälykehittäjä tai tietovaraston toimittaja. Vaikka tietovarasto ja tekoälyprojekti ovat hyvin erityyppisiä, niin silti kummassakin tarvitaan liiketoiminnan ja teknisen väen yhteistoimintaa.

Nyt joku lukija miettii, että näinhän ennenkin on tehty. Liiketoiminta speksaa IT:n kanssa ja välissä saattaa olla business analyytikoita, liiketoimintakonsultteja tulkkina.

Usein määritykset tehdään käyttötapausten sekä vaatimusmäärittelyn kautta. Se tehdään yleensä tekstimuotoisesti kuvaillen laajasti eri käyttötapauksia, käyttäjäpersoonia,- ja polkuja pikkuhiljaa edetään toiminnallisuuksiin.

Tällaiset dokumentit ovat usein varsin pitkiä ja työläitä luettavia ja ihmisen tiedonkäsittelykyvyt alkavat olla koetuksella. Jos haluat suunnistaa, on helpompi käyttää karttaa kun tukeutua vain sanallisiin ohjeisiin.

Samoin talonrakennusprojekti toimii parhaiten piirustuksen avulla. Kuva kertoo enemmän kuin tuhat sanaa: datakartan ilmaisuvoima on erittäin suuri. Väitän että parhaat toteutukset perustuvat hyvään mallinnukseen.

Käsitemalli toimii myös happotestinä. Menevätkö käyttötapaukset ja datamallin yksi yhteen? Sanallisissa kuvauksissa usein jää jotain erittäin kriittistä huomaamatta. Kun minut pyydetään korjaamaan vikaan mennyttä ratkaisua, on kyse melkein aina tästä

Datamallin hyödyntäminen

Nyt meillä on liiketoiminnan avulla tehty käsitemalli, sitä pitää myös hyödyntää. Eihän hyödytä tehdä pohjapiirrustusta talosta, jos ei ikinä rakenna taloa.

Kuka mallin sitten tekee? Sen voimme tehdä me tai joku muu joka osaa mallinnuksen hyvin. Kunhan liiketoiminta on siinä mukana. Sitten alkaa teknisempi vaihe. Joskus IT/Data-osaajat saattavat ajatella, että vaikka malli olisi tehty, he tekevät uuden mallin.  Esim tietovarasto-, BI-toimittaja saattaa suhtautua penseästi tilaajan malliin ja haluaa edetä itse nopeasti tekniseen malliin.

Tämä vastaa hiukan sitä, että talonrakentaja hylkää arkkitehdin piirustukset ja tekee vain omat rakennepiirustukset. Mutta voiko teknisten ja monimutkaisten rakennepiirustusten kanssa keskustella hyvin rakennuksen tilaajan kanssa? Ei ole helppoa.

Liiketoiminta ei halua nähdä teknisiä kuvauksia kuten tietokantasuunnitelmia. Heidän näkemyksensä ja tarpeensa jäävätkin taka-alalle ja syntyy kuilu liiketoiminnan ja toteutuksen välille.

On siis tärkeää pitää huolta siitä, että tehty liiketoimintalähtöinen käsitemalli on lähtökohtana suunniteltaessa teknistä ratkaisua. Se on ikään kuin kerros, johon saadaan huomioitua liiketoiminnan näkemykset. Tämä on juuri käsitemallin ja Ellien idea.

Malli kannattaa olla koko projektin ajan kaikkien saatavilla. Jos tulee muutoksia tai teknisiä hankaluuksia, niin kuin lähes aina tulee, niin voidaan välillä käydä tarkastamassa että pitääkö alkuperäistä suunnitelmaa muuttaa vai mitä tehdään.

Ellie on pilvipohjainen ja sen kautta mallit voi jakaa netissä kaikille asianosaisille. Osa voi katsella ja osalle annetaan muutoksoikeudet,

Vie tekoälyprojekti tuotantoon

Edistyneen Analytiikan tai tekoälyn kokeiluissa se on se haaste, että sen tuotantoon viemisen proseduuria ei tunneta eikä mietitä ajoissa.

Ellien avulla voimme suunnitella jo koneoppimisen algoritmien tuotantoon viemisen jo alkuvaiheessa. Määritämme ensin liiketoimintahaasteen visuaalisen mallin avualla ja tämän lisäksi otamme malliin mukaan myös sen alueen, jolla algoritmi pitäisi vielä tuotantoon.

Näin voimme ottaa tästä alueesta vastaavan johtajan mukaan keskusteluun. Sitoutan hänet hyödyntämään algoritmia, jos se toimii. Tai ainakin tiedämme sen, että missä kohtaa algoritmin tuotantoon vienti tulisi tapahtua ja kenet pitäisi sitouttaa.

Tekoälyosaajat osaavat koneoppimisen algoritmit mutta ei tuotantoon viemistä tai mitä se tarkoittaa ison organisaation prosesseissa ja niiden johtamisessa.

Dataprojetit ovat monimutkaisia ja edellyttävät yksikköjen välistä yhteistyötä. Ellien keskeinen ajatus on se, että mallit voidaan yhdistää yli yksikkörajojen.

Kokonaisuus haltuun

Joku miettii, että hyvä on, ymmärrän että kannattaa tehdä pohjapiirrustus Ellieen tiettyä projektia varten. Mitä teen sillä sen jälkeen? Sitten kun tietovarasto on valmis tai tekoälyprojektin hoidettu, mihin enää tarvitsen Ellietä?

Kun teemme datamallin yhteen projektiin, tulemme silloin kuvanneeksi yhden osan datavarannostamme. Perinteisellä tavalla tehtynä, tällaiset mallit usein hukkuvat tai eivät ole silloin saatavilla, kun tarvitaan.

Ellien avulla määritykset jäävät talteen ja ovat uudelleenkäytettäviä seuraavissa kaavioissa, samalla siis rakentuu mallien kokonaisuus.

Yksi malli on myös ikään kuin tilkkutäkin yksi osa. Pikkuhiljaa saamme aikaiseksi koko ison tilkkutäkin, eli kokonaiskuvan datavarannostamme.

Miten tämä siis tapahtuu? Jos meillä on vaikkapa malli, jossa on määritelty miten asiakas, projekti ja lasku liittyvät toisiinsa sekä missä näihin liittyvät data sijaitsevat.

Seuraavaksi mallinnetaan taloushallintoa, jossa ovat mukana mm. kustannuspaikka, projekti ja tili. Näin kokonaisuus rakentuu pala palalta. Myös vastuu,- ja muut hallinnolliset (ns. data governance) asiat selkiytyvät tässä prosessissa.

Kun jatkamme tätä työtä, saamme pikkuhiljaa datavarantojamme haltuun kokonaisvaltaisesti ja meillä alkaa olla kartta, jonka avulla suunnistamme IT-järjestelmien ja datan viidakossa.

Kuka sitten vastaa datakokonaisuudesta? Yksittäisten liiketoiminta-alueiden vetäjät eivät yleensä pidä huolta kokonaisuudesta, koska heitä palkitaan oman alueensa kehittämisestä, ei naapurin. Juuri siksi syntyy erillisiä siilomaisia ratkaisuja. On myös riski, että käsitemallit muodostavat vain erillisiä siiloja.

Nyt tarvitaan joku, joka vastaa datan kokonaisnäkemyksestä. Sellainen rooli voi olla esim CIO:lla tai nykyisin CDO:lla (Chief Data Officer), siis C-tason henkilöllä.

IT-osaston arvo nousee: siellä istutaan tukevasti datavarannon päällä ja kokonaisuuden ollessa hallussa pystytään tukemaan datan kuluttajaa parhaalla mahdollisella tavalla.

Jos emme etene kuten tässä kuvasin, vaarana on, että kaikki asiat määritellään aina uudestaan jokaisen projektin kohdalla.

Miten se teknologia sitten?

Nyt kun on tehty kaikenlaista määritystä ja mallinnusta, niin päästäisikö nyt sitten toimittajan puheille ja voisiko nyt puhua teknologiasta vihdoin? Kyllä, mutta vieläkään ei kannata avata lompakon nyörejä isosti ja lähteä isoihin teknologiainvestointeihin. Kannattaa tehdä aluksi testejä, demoja ja Poc:ja ja saada liiketoiminnalle tuloksia aikaan mahdollisimman nopeasti.

Kun olemme testanneet ja demonneet, vasta sitten on teknologiavalintojen aika, toteutusten rakentaminen ja lopulta tuotantoon siirtyminen. Kun asiat tehdään oikeassa järjestyksessä säästämme lopulta todella paljon aikaa. Varsinkin jos meillä on dokumentoituna, kuvaukset, datan puolivalmisteet ja algoritmit.

Alussa kerron, että monesti dataongelmista tehdään teknologiaongelmia liian varhain.

Mielenkiintoista kyllä, hyvin moni edelleen ajattelee niin. Että jos en saa jotain dataa hyödynnettyä, pyydetään esim joku työkalutoimittaja tai ohjelmistotalo kertomaan että miten he asian ratkaisevat.

Monia erittäin hyviä tietokantoja, BI-välineitä ja analytiikkatuotteita on tarjolla – niitä kannattaa käyttää. Valitettavasti on vaan niin, että ei ole olemassa yksittäistä teknologiaa joka ratkaisisi tämän kaiken loppukäyttäjän puolesta. Työkalu edellä -ajattelu ei toimi, jos ei tiedetä mitä ollaan tekemässä.

Ellie on työkalu siinä missä jokin muukin työkalu. Eli sama juttu Ellien kanssa: mieti ensin voitko toteuttaa tämän kaiken nykyisillä järjestelmillä. Samaan tapaan, kuin esim jokin tietokantatuote, Ellie ei yksin ratkaise mitään. Ensin on ymmärrettävä miten ja mihin sitä käytetään.

Kokemuksemme mukaan liiketoiminnan ihmiset eivät mielellään tutki teknisten tietokannan suunnitteluvälineiden malleja eivätkä pysty ymmärtämään niiden monimutkaisia ja usein todella laajoja spagettikuvauksia.

Monilla on käytössä Erwin, ER-Studio, Vision tai muita mallinnus-, piirto- ja arkkitehtiuurityökaluja, miksi käyttäisimme Ellietä? Meidän liiketoimintalähtöisiin mallinnuksiimme nämä ovat liian teknisiä. Siksi kehitämme Ellietä omien toimeksiantojemme tueksi.

Itse käytämme lähes kaikissa hankkeissa Ellietä, koska se on erittäin helppokäyttöinen ja sopii juuri liiketoimintalähtöiseen mallinnukseen. Se on pilvipohjainen – ei asennuksia – joten mallit on helppo jakaa ja ne eivät huku.

Keskitetty datakatalogi on erittäin tärkeässä roolissa, kaikki yhdessä tehdyt kuvaukset siis löytyvät. Ellie tukee organisaatio-tasoista mallinnusta ja esimerkiksi kerran määritelty käsite asiakas on helposti uudelleenkäytettävissä muihin malleihin.

Mallit ovat siis keskitetysti yhdessä paikassa kaikkien saatavilla kun niitä tarvitaan. Niitä käytetään edellä mainitulla tavalla liiketoiminnan johtamiseen sekä tekoäly- ja edistyneen analytiikan projekteihin.

Palatkaamme alkuperäiseen ongelmaan: liiketoiminta ja teknisempi väki eivät ymmärrä toisiaan tarpeeksi hyvin ja töitä tehdään liian usein siiloissa tai liian IT-vetoisesti. Uskon että datakeskeinen ajattelu tässä kertomani menetelmien ja välineiden myötä voi auttaa läpimurtoon näiden ongelmien selättämisessä.

Ystävällisin terveisin,

Ari Hovi & tiimi

Ps. Minulle itselle yksi viime vuosien vaikuttavimmista koulutuskokemuksista on ollut Stephen Brobstin koulutus:

Data Science, Big Data Analytics and Advanced Practices in Data Visualization, 29.11.2018 – 30.11.2018

Koulutus soveltuu kaikille, joita kiinnostaa datakeskeinen ajattelu ja sen liittäminen organisaation strategiaan. Aikaisempina vuosina osallistujat ovat kertoneet, että jopa kokeneelle data-ammattilaiselle koulutus tuo paljon uutta. Sen avulla näet maailman hieman eri tavoin ja tiedät, miten datan hyödyntäminen voidaan nostaa täysin uudelle tasolle.

Lue lisää tästä.

Saattaisit olla kiinnostunut myös näistä

Tietovaraston paras arkkitehtuuri

Lue lisää

Strategia antaa kontekstin datatyölle

Lue lisää

TIETOJEN HELIKOPTERIKUVALLA JOHDETAAN YHTEISTYÖTÄ

Lue lisää