Hei,
Olette ehkä huomanneet, että ihmisillä on nykyään tapana julistaa asioita “kuolleiksi”. SQL on julistettu kuolleeksi jo moneen kertaan. Data Mesh on saattohoidossa, ja Big Datan hautajaisia vietettiin jo ajat sitten.
Koodaaminenkin on kuulemma kuollut, kiitos “vibe codingin”. Ja modernin data stackin myötä on väitetty, että myös tiedon mallinnus on kuollut.
Mutta asetelma on väärä. Mallinnus ei ole kadonnut, vaan muuttunut. Se on nousemassa uudelle tasolle, sellaiselle, jota emme vielä täysin hahmota.
Tekoälyn aikakaudella mallinnus ei ole vähemmän tärkeää. Se on tärkeämpää kuin koskaan. Koska tekoäly ei ymmärrä dataa, ellei joku ensin mallinna sitä, mitä tieto tarkoittaa.
Miksi mallinnusta tarvitaan yhä?
Mallinnuksen tarkoitus ei ole tietokanta tai skeema. Sen tarkoitus on luoda yhteinen ymmärrys datasta, rakenne, jota sekä liiketoiminta että dataosaajat voivat käyttää ilman arvaamista.
Kun mallinnus jätetään väliin, olemme alttiita seuraaville riskeille: määritelmät hajoavat, logiikka hämärtyy tai sitä ei ole, ja jokainen uusi raportti ja dashboardi tuntuu alkavan alusta.
Alamme kuulla liiketoiminnalta valituksia siitä, miksi datan saaminen on niin hidasta, miksi datan käsittelyyn liittyvät kustannukset kasvavat ja miksi data-alustan tiedot poikkeavat liiketoimintayksiköiden omista Excel-taulukoista.
Tämä on se hetki, jolloin organisaatio huomaa, että olisi ehkä kannattanut piirtää se “pohjapiirros” ennen rakentamista.
Mutta koskaan ei ole liian myöhäistä, vaikka ”mallinnusvelkaa” on päässyt syntymään, voit alkaa vähentää sitä.
Dataprojekteissa on toki paljon kehitystyötä: koodia, pipelineja ja integraatioita, joita hoitavat data engineerit. Mutta niiden rinnalla on toisenlaista tekemistä, jota kutsun non-dev-työksi: se on hyvän designin tekemistä, yhteistyötä, kommunikointia, määrittelyjä ja kaikkea sitä säätöä, jota moni koodari sydämestään vihaa.
Mutta tässä tulee kylmä fakta: projekti onnistuu tai epäonnistuu juuri näissä vaiheissa. Harvoin ongelma on itse koodissa, lähes aina se löytyy suunnittelusta, määrittelystä ja yhteisen ymmärryksen puutteesta.
Moderni datastack ei tee mallinnuksesta turhaa, se tekee siitä tärkeämpää
Työkalut kuten dbt, Snowflake, Databricks ja Microsoft Fabric ovat mullistaneet datan käsittelyn. Ne ovat tehneet tallentamisesta, muuntamisesta ja analysoinnista nopeaa ja helppoa.
Samalla ne ovat kuitenkin luoneet vaarallisen illuusion: että mallinnusta ei enää tarvita. Osa ajattelee, että sen kun koodataan menemään vaan. Tämä onnistuu kyllä, jos projekti on pieni ja pistemäinen, ja ymmärrän, joskus on kiire ja pitää ottaa “velkaa”.
Mutta jos halutaan oikeasti panostaa data-arkkitehtuuriin ja tehdä yhtään isompaa data-alustaprojektia, jossa on useampi tekijä, niin en suosittele. Jos haluat skaalautuvuutta ja tuotteistaa dataratkaisuja, on oikeastaan pakko tehdä designia.
Kun rakenteet jätetään miettimättä, syntyy pipelineja, joita kukaan ei ymmärrä, raportteja, joiden logiikka toistuu, ja dataa, johon kukaan ei enää luota.
Juttelen edelleen jatkuvasti talous- ja muun liiketoimintajohdon kanssa, ja iso haaste on luottamus dataan. Jos puhutaan ns. datan laadusta, niin ihan ensimmäinen asia on tiedon mallinnus.
Moderni teknologia ei siis poista mallinnuksen tarvetta, se nostaa sen merkityksen uudelle tasolle.
Moderni mallinnus on ajattelua, ei dokumentointia
Perinteisesti mallinnus on mielletty hitaaksi ja byrokraattiseksi dokumentointiharjoitukseksi. Mutta moderni mallinnus on kaikkea muuta: se on nopeaa, iteratiivista ja yhteisöllistä ajattelua.
Mallinnusta voi nykyään tehdä tekoälyn avustamana aivan uudella nopeudella. Esimerkiksi Ellie.ai:n eräällä asiakkaalla on jo yli sata aktiivista käyttäjää. Mallit voidaan jakaa linkin kautta, niihin voi kommentoida suoraan, ja käyttäjä saa heti ilmoituksen muutoksista. Näin mallinnus ei ole irrallista dokumentointia, vaan osa päivittäistä yhteistyötä ja tekemistä.
En suosittele mallinnusta mallinnuksen vuoksi, eikä ensimmäiseksi kannata lähteä rakentamaan mitään massiivista “enterprise-mallia”.
Kun mallinnusta tekee pala kerrallaan, dokumentaatio ja kokonaismalli syntyvät lähes huomaamatta. Toisin sanoen: projektia tekemällä, suunnittelemalla ja koodaamalla tietomallit syttyvät kuin itsestään.
Modernin mallinnuksen ytimessä ei ole täydellinen kuva, vaan yhteinen ymmärrys. Ja juuri tämä ymmärrys liittyy siihen non-dev-työhön, joka lopulta ratkaisee projektin onnistumisen.
Ei siis sanota “tehdään tämä loppuun ennen kuin aloitetaan”, vaan “aloitetaan tärkeimmästä ja kehitetään yhdessä”.
Hyvä malli ei hidasta kehitystä, se kiihdyttää sitä. Se tekee datasta tuotteita, ei projekteja.
Semanttinen arkkitehtuuri – uuden aikakauden mallinnus
Tulevaisuuden organisaatiot eivät rakenna enää pelkkiä datavarastoja.
Ne rakentavat älykkäitä ekosysteemejä, joissa liiketoimintaprosessit, tekoälyagentit ja data muodostavat yhteisen kielen. Tämän kielen nimi on semanttinen arkkitehtuuri.
Ajatus kuulostaa ehkä abstraktilta, mutta se on itse asiassa hyvin konkreettinen. Katsotaan, mistä siinä on kyse.
Liiketoiminta – missä arvo syntyy
Kaikki alkaa liiketoiminnasta. Otetaan esimerkiksi myyntiprosessi:
Tarjous, asiakas, onboarding, laskutus, reklamaatiot.
Nämä ovat organisaation hermoratoja, joissa arvo syntyy. Ne kertovat, mitä pitää tapahtua ja missä järjestyksessä. Mutta ne eivät vielä kerro, miten data virtaa prosessien sisällä, tai miten tekoäly voisi auttaa niitä toteutumaan älykkäämmin.
Tekoälyagentit prosessien sisällä
Tässä kohtaa astuvat kuvaan AI-agentit. Ne eivät korvaa koko prosessia, vaan usein yksittäisiä workfloweja sen sisällä, eli pieniä mutta kriittisiä tehtäväketjuja.
Tarjousagentti voi generoida asiakaskohtaisen tarjouksen CRM-datasta. Onboarding-agentti kokoaa asiakkaan perustiedot ja laukaisee hyväksynnät. Laskutusagentti lukee sopimusehdot ja muodostaa laskut automaattisesti.
Mutta nämä agentit eivät “ymmärrä” mitään ilman kontekstia. Ne tarvitsevat semanttisen ymmärryksen, käsityksen siitä, mitä data tarkoittaa, miten entiteetit liittyvät toisiinsa ja missä prosessin vaiheessa ne ovat.
Ilman tätä tekoäly on kuin työntekijä, jolle annetaan kasa Exceleitä mutta ei ohjeita.
Semanttinen ja hallinnollinen perusta
Kaiken alla on semanttinen ja hallinnollinen taso – se osa arkkitehtuuria, joka määrittää datan merkityksen, rakenteen ja vastuut.
Tämä on se kohta, jossa tiedon mallinnnus ja data governance kohtaavat.
Tietomalli luo käsitteellisen kartan datasta ja sen suhteista. Data governance varmistaa, että tuota karttaa noudatetaan, että datalla on omistaja, laatu ja käyttötarkoitus.
Kun nämä yhdistetään semanttisen arkkitehtuurin kautta, syntyy järjestelmä, jossa tekoäly ei vain käsittele dataa, vaan ymmärtää sen.
Näin AI-agentti ei enää toimi irrallisena automaationa, vaan älykkäänä toimijana osana organisaation prosessiekosysteemiä.
Mallinnus ei ole kuollut – se on noussut uuteen rooliin
Tietomallinnus ei ole menneisyyden jäänne. Se on edelleen se hiljainen voima, joka erottaa kaaoksen järjestyksestä.
Sen rooli vain muuttuu. Mallinnus ei enää ole pelkkä dokumentointityö, vaan organisaation älyn kieli. Se on se rakenne, joka tekee tekoälystä oikeasti älykkään.
Tulevaisuudessa emme rakenna vain datavarastoja – me rakennamme semanttisia ekosysteemejä, joissa data, prosessit ja tekoäly puhuvat samaa kieltä.
Ja tämä kieli on semanttinen arkkitehtuuri.
Kiitos että olet lukenut blogini, arvostan! Muista myös katsastaa pari timanttista koulutusta, jolle vielä mahtuu: Data modeling guru Alec Sharpin kurssi Business oriented data modeling ja SQL Advanced.
Verkostoidun mielelläni kaikkien kanssa, eli pistäkää matalalla kynnyksellä verkostoitumiskutsua Linkedinissä.
Ystävällisin terveisin,
Johannes Hovi