Hei,
Datan rooli kilpailukyvyn moottorina on vähitellen tiedostettu. Kasvava joukko organisaatioita pyrkiikin määrätietoisesti datavetoiseksi.
Ensimmäiset organisaatioista ovat myös kantapään kautta oppineet, että datavetoiseksi tuleminen vaatii muutakin kuin teknologian ostamista ja konsulttien palkkaamista.
Datavetoisuus vaatii sitä, että organisaation eri toiminnoissa työskentelevät asiantuntijat osaavat soveltaa dataa toiminnan kehittämisessä. Asiantuntijoilta vaaditaan parempaa dataymmärrystä, jota myös datanlukutaidoksi kutsutaan.
Tietomallit ovat datatuotteiden rakennuspiirustuksia
Olemme paljon puhuneet tiedonmallinnuksesta välineenä datanlukutaidon nostamisessa. Toisin kuin fyysiset tuotteet, tietotuotteet ovat abstrakteja ja siksi niitä on vaikea ymmärtää ja niistä on vaikea kommunikoida.
Rakennuspiirustuksilla visualisoidaan vielä suunnitteluasteella olevia rakennuksia. Niiden avulla arkkitehdit, rakentajat ja rakennuksen käyttäjät pystyvät sujuvasti keskustelemaan erilaisista teknisistä ja toiminnallisista vaatimuksista.
Tiedonmallinnuksella visualisoidaan tulevia tietotuotteita, ja niiden avulla kehittäjät ja käyttäjät voivat vastaavasti tehdä yhteistyötä.
Jos kehitetään tietotuotetta esimerkiksi asiakaskannattavuuden mittaamiseen, tietomalleilla pystytään visualisoimaan kaikkia niitä asiakkaisiin kohdistuvia lukemattomia kulueriä materiaalihankinnoista myyntiin ja asiakaspalveluun asti.
Tietomallien lisäksi pitää ymmärtää liiketoimintasääntöjä
Kaikkea ei pystytä tietomalleilla kuvaamaan. Asiakaskannattavuuden mittaamisen pitää lisäksi ymmärtää liiketoimintasääntöjä, joilla kulueriä koostetaan ja jyvitetään asiakkaittain.
Nämä liiketoimintasäännöt toteutetaan tyypillisesti SQL:llä. Tietomalleilla kuvataan lähtötiedot, ja SQL:llä kuvataan loitsut, joilla lähtötiedoista muodostetaan kannattavuustietoja.
Tässä kohtaa puhelin on usein rikki. Liiketoiminta-asiantuntija kommunikoi liiketoimintasäännöt IT-asiantuntijalle, ja IT-asiantuntija kääntää säännöt SQL:lle.
IT:n ja liiketoiminnan kommunikaatio-ongelmat ovat jo tuttuja, mutta väärinkäsitykset syntyvät usein jo aiemmin.
Liiketoimintasäännöt ovat usein monimutkaisempia kuin liiketoiminta-asiantuntijat tiedostavatkaan. Asiakassopimuksissa voi olla kymmenittäin myyjien tekemiä poikkeuksia, joiden tulisi vaikuttaa kustannusten allokointiin. Poikkeamia ei virallisesti hyväksytä, eikä niitä virallisesti siis ole olemassa.
Totuus paljastuu vain oikeaa dataa penkomalla. Jos liiketoiminta-asiantuntija ei poikkeamista tietä, ei hän niitä IT-asiantuntijalle myöskään kommunikoi.
IT-asiantuntijalla taas ei ole useinkaan kykyä poikkeamien tunnistamiseen datasta. Lopputuloksena kustannukset allokoidaan väärin.
Liiketoiminta-asiantuntijoiden pitäisi osallistua tähän työhön, mutta se vaatii jossain määrin myös heiltä itseltään datan penkomista, koska ”devil is in the details”. Tätä voi tehdä yhdessä IT-asiantuntijan kanssa, mutta ihannetilanteesa liiketoiminta-asiantuntija itsekin ainakin osaa tulkita peruskyselyjä.
SQL-lukutaito kehittää datanlukutaitoa
SQL-peruskurssi on yksi suosituimmista koulutuksistamme. Viimeisen parin vuoden aikana osallistujajoukossa on kasvavassa määrin näkynyt yllä kuvattu ongelma.
Raportoinnissa on havaittu ongelmia, ja asiantuntijat ovat tiedostaneet, että heidän tulee itse syventyä syvemmin itse dataan ongelmien ymmärtämiseksi.
Kursseille on osallistunut asiantuntijoita ja anatlyytikoita organisaatioiden eri toiminnoista tuotannosta liiketoimintayksiköiden business controllereihin.
Useat ovat vasta-alkajia SQL:ssä, mutta toiset ovat jo tutustuneet SQL:ään perehtymällä IT-asiantuntijoiden tekemiin scripteihin ja modifioimalla näitä.
Tätä kautta he ovat myös havainneet, että SQL on pohjimmiltaan yksinkertainen, liiketoimintalähtöinen ja helposti opittava kieli.
Osa peruskurssin osallistujista on itseoppineita SQL:n harjoittajia, joilla on jo vuosien kokemus. Syntaksi on siis tullut jo hyvinkin tutuksi, mutta he haluavat ymmärtää SQL:n logiikkaa siellä syntaksin taustalla.
Tämä SQL:llä taustalla olevan logiikan ymmärtäminen onkin hyvin oleellinen palanen datanlukutaitoa. Valtaosa organisaatioiden datasta on relaatiotietokannoissa, joiden kysely perustuu tähän logiikkaan.
Onneksi logiikka perustuu yksinkertaisiin periaatteisiin, ja jokainen peruskurssin kävijä osaakin kahden päivän jälkeen tehdä jo varsin monimutkaisia kyselyjä, olipa sitten vasta-alkaja tai kokeneempi itse oppinut SQL-harjoittaja.
Kuinka tärkeä taito SQL on
Viime keväänä selvittelin oman koulutustarjoomamme kehittämiseksi, mitkä ovat maailmalla kysytyimpiä datataitoja.
Törmäsin tällöin KD nuggets -sivuston artikkeliin ”The Most In-Demand Skills for Data Scientists in 2021”.
Data Scientisteja palkatessa SQL on toiseksi kysytyin taito heti Pythonin jälkeen. Vaikka SQL:n merkityksen tunnen hyvin, vähän itsekin hämmästyin, että selvästi taakse jäävät niin Spark, AWS, TensorFlow, Scala kuin moni muu.
Data Scientistit ovat kuitenkin niitä, jotka liikkuvat aallonharjalla uuden osaamisen suhteen.
Vielä suurempi hämmästys oli, että SQL-osaamisen tarve on toiseksi nopeimmassa prosentuaalisessa kasvussa heti AWS:n jälkeen.
Tarve SQL-osaamiselle on siis ennätyksellisen vahvassa prosentuaalisessa kasvussa jo absoluuttisesti korkealta huipputasolta. SQL-osaajille on siis erinomaiset ja kasvavat työmarkkinat.
Miksi tarve vuosikymmeniä vanhalle SQL:lle on sitten näin suurta.
Toisaalla samassa artikkelissa oli tähän hyvä tiivistelmä:
”SQL is arguably the most important skill to learn across any type of data-related profession, whether you’re a data scientist, data engineer, data analyst, business analyst, the list goes on.”
SQL on siis peruskieli, jota tarvitsevat kaikki hardcore-devaajista liiketoiminta-analyytikoihin. Mikään ei ole SQL:ää kyennyt korvaamaan, eikä ole myöskään korvaamassa.
Ystävällisin terveisin,
Hannu Järvi