03.03.2020

Tiedon mallinnus ja Business Glossary – Ellien suosio kasvaa

Hei,

Onko tuttu tilanne, että ihmiset käyttävät eri käsitteitä puhuessaan samasta asiasta?

Data-analytiikan kohdalla yhteisten määritysten löytäminen on erityisen tärkeää.

Kirjoitan tästä siksi, että Ellie-sovellukseen on tulossa uusitut ns Business Glossary-ominaisuudet.

Kaikille uusille lukijoille kerrottakoon, että Ellie on uusi liiketoimintalähtöinen datan mallinnustyökalu tietojohtamiseen.

Sitä käytetään pörssiyrityksissä sekä julkisen puolen organisaatioissa, kuten HUS:illa.

Palataan Business Glossaryyn, mitä sillä tarkoitetaan? Onko Ellie itse asiassa Business Glossary työkalu vai tietomallinnusohjelmisto?

Käsitteiden määrittäminen vaikeus

Yrityksillä on paljon erilaisia IT-järjestelmiä, jossa on eri määritykset käsitteille.

Business Glossaryllä tarkoitetaan liiketoimintakäsitteiden määritystä data-alueen tarpeita varten. Se on siis ikään kuin sanakirja liiketoiminnan käyttämistä termeistä.

Yhdenmukaistamista tarvitaan, kun työhön liittyy eri järjestelmien välistä säätämistä. Järjestelmissä nimittäin asioita kutsutaan eri nimillä.

Ja me dataihmiset tiedämme, että sitähän se monasti on.

Mietitään esim sanaa asiakas. Se kuulosta aluksi yksinkertaiselta ja ymmärettävältä, mutta se ei sitä suinkaan ole.

Onko asiakas sellainen joka ostaa yritykseltä vai onko asiakas sellainen joka on kirjautunut palveluumme? Onko asiakas asiakkaan yhteyshenkilö vai tarkoittaako se yritystä?

Jos nämä ovat epäselviä, miten lasketaan asiakkaiden lukumäärä?

Sosiaali,- ja terveys puolella, jossa Ellietä paljon käytetään, määritykset ovat huomattavan tärkeässä roolissa.

Emme voi laskea hoitoon liittyviä asioita, jos emme tiedä mitä tarkoitetaan sairaalavierailulla. Koostuuko se useasta hoitojaksosta ja mitä jos potilas käykin välillä kotona?

Päänvaivaa aiheuttaa myös se, että esimerkiksi sama ihminen on terveydenhuollossa potilas ja sosiaalipuolella asiakas.

Olisi outoa jos sosiaalipalveluissa sinua puhuteltaisiin potilaaksi, mutta potilaaksi kuitenkin muutut, jos joudut sairaalaan.

Liiketoiminnan kehittäminen on vaikeaa ilman käsitteitä

Nämä kysymykset aiheuttavat paljon harmaita hiuksia IT-ihmisille. Esim eräs iso suomalainen kaupunki ei kuulemme tähän päivään mennessä ole pystynyt laskemaan montako asiakasta sillä on.

Tämä johtuu juuri siitä, että määritelmä oli niin epäselvä.

Yrityksillä tämä vaikeuttaa kehittämistä. Emme tiedä, kuinka monesta potentiaalisesta asiakkaasta tulee ostava asiakas, kun määritys puuttuu.

Myös henkilöstön kokoluokkaa voi olla vaikea sanoa. Monet isot organisaatiot voivat antaa tästä vain arvion.

On alihankkijoita, konsultteja, toimittajia, harjoittelijoita, kumppaneita, vuokratyövoimaa sekä palkkatyöläisiä.

Totuuden tietäminen omasta liiketoiminnasta vaikeutuu, kehittäminen ei onnistu. Tietojohtamisen hyödyntäminen ei ota tuulta purjeisiinsa.

Tähän voidaan kuitenkin panostaa, kuten maailman johtavat yritykset ovat tehneet.

Miksi Google ja Facebook ovat niin hyviä kehittämään liiketoimintaa? Koska heillä on dataa liiketoiminnastaan olemassa. He tietävät tasan tarkkaan kuinka moni käyttäjä ostaa heidän palvelujaan.

Ei siis ole ihme, että nyt kaikki haluavat kehittää tietojohtamista.

Missä käsitteitä ylläpidetään?

Tietovarastoprojektissa määritykset ovat hyvin tärkeitä. Mehän haluamme nimenomaan sen avulla tehdä analytiikkaa ja auttaa esimiehiä saamaan dataa omasta alueestaan.

Ellietä käytetään juuri tietovaraston suunnitteluun.

Sen avulla data-arkkitehti tai IT-osaaja jumppaa liiketoiminnan kanssa määritykset. Sitten ne jäävät Ellieen talteen, ja kun se pilvipohjainen, kuka vain voi käydä niitä sieltä katsomassa – tietysti käyttöoikeuksien puitteissa.

Osa lukijoista on sitä mieltä, että Business Glossarya voidaan ylläpitää muulla tapaa, Ellietä ei välttämättä tarvita siihen.

Business Glossary-ominaisuuksia on usein data catalog ja metadata-järjestelmissä, koska se on olennainen osa niiden ominaisuuksia.

Ellie voidaan kuitenkin integroida data catalog-järjestelmiin, jolloin Ellie toimii master-järjestelmänä.

Integraation erääseen data catalog-tuotteen on nyt tulossa suunnittelupöydälle, koska asiakkaallemme on tähän tarve.

Näissä tuotteissa ei ole myöskään käsitemallinnustyökalua, joka on olennaista Business Glossarylle.

Jos määrittelemme liiketoimintakäsitteiden määritykset sanalliseen muotoon, jotain olennaista jää puuttumaan. Nimittäin miten liiketoimintakäsitteet suhteutuvat toisiinsa.

Käsitemallinnusta (conceptual modeling) käytetään tietovarastojen suunnitteluun juuri tästä syytä.

Menetelmä avaa uuden näkökulman Business Glossaryyn.

Kaikki haluavat suhteita

Voisi sanoa, että ihmiset ja tietovarastot muistuttavat toisiaan, kummatkin pitävät suhteista.

Me ihmiset tykkäämme ihmissuhteista, kuten pari,- ja ystävyyssuhteista. Me usein myös määrittelemme itsemme suhteiden kautta, kuten työsuhteen kautta.

Tietovarastot perustuvat suhteille, siksi niitä sanotaan relaatiopohjaisiksi tietokannoiksi ja ne toteutetaan yleensä relaatiokannoilla.

Tietovarastoissa määritllään käsitteelle yksi tai useampi suhde (relaatio) toisiin käsitteisiin. Ne ovat ratkaisevan tärkeässä osassa käsitteen määrittelyssä.

Esimerkkejä.

Asiakkaalle lähetetään lasku. Piirretään mallissa yhdysviiva asiakkaan ja laskun välille. Näin muodostuu laskutussuhde, joka kertoo että asiakkaita ovat ne joille lähetetään lasku.

Nyt data-analyytikko voi laskea tietokannasta kuinka monelle tämä ehto täyttyy, eli montako on laskutettu viime vuonna.

Huomaatko nyt, miten käsitteen sanallisen määrittelyn lisäksi suhteet vaikuttavat sen määrittelyyn? Saimme tarkan määrittelyn käsitteelle asiakas.

Toinen esimerkki: Ihminen muuttuu työnhakijasta työntekijäksi, kun hänelle tehdään työsopimus.

Jälleen muodostamme suhteen, tällä kertaa työsuhteen. Nyt voimme laskea kuinka monta työsopimusta meillä on ja päätellä siitä työntekijöiden määrän.

Itse asiassa kaikkea maailman liiketoimintaa ja organisaatiota voidaan kuvastaa suhteiden avulla. Ne ovat kaikki kaikessa. Vai millainen olisi firma, jolla ei olisi asiakkaita tai työntekijöitä?

Tietovarastojen tietomallien logiikka perustuu siihen, että tietokantaan rakennetaan ja talletetaan juuri nämä suhteet.

Herää kysymys: miten osaamme määrittää nämä suhteet? Kuka näistä suhteista tietää? Mihin ne on kirjattu?

Saatavuus on tärkeää

Vastaus edellisiin kysymyksiin on, että vain liiketoiminta tietää suhteet eikä niitä ole dokumentoitu kunnolla mihinkään.

Niitä kaivetaan yleensä liiketoiminnan päästä sekä IT-järjestelmistä.

Ellien avulla voimme rakentaa käsitemallin, jossa kaikki kuviteltavissa olevat suhteet on määritelty.

Jos arvostat tehokkuutta, niin hyvä uutinen on se, että tämän Ellie tekee paremmin kuin yksikään työkalu: käsitemallien tuottaminen on sen avulla hyvin nopeaa.

Ja nyt ne jäävät oikeasti talteen ja niihin pääsee nopeasti käsiksi. Tämän merkitystä ei kannata aliarvioida.

Kun kerran esittelin Ellietä uudelle asiakkaalle, kerroin että sinulla menee alle puoli minuuttia kun avaat Ellien selaimeen ja voit katsella mallia.

Vastapuoli ei heti ymmärtänyt miksi tämä on tärkeää. Parin viikon kokeilujakson jälkeen hän soitti tohkeissaan että tämä on mahtavaa, että kerrankin tietoihin pääsee nopeasti käsiksi.

Jos mietit, niin usein kesken palaverin pitäisi päästä johonkin IT-järjestelmään käsiksi, mutta käyttöoikeus puuttuvat eikä kukaan tunnut tietävä mistä ne saa. Ainakaan palaverin aikana se ei järjesty.

Tämän halusimme Elliessä muuttaa. On yllättävän kätevää, että Ellie toimii kaikilla selaimilla netissä.

Kuulostaa itsestään selvältä, mutta sitä se ei ole. Olen jo useamman kerran kuullut asiakkaalta, että mitä näin yksinkertaista asiaa ei oltu ennen tajuttu hoitaa kuntoon ja miten on ennen tultu toimeen ilman Ellietä.

Ellien mallit suoraan dataputkeen

Jos ei tunne Ellietä ja yllä kuvattu ongelmaa ei osata ehkä sanallistaa, huomaan tämän johtava epäilevään asenteeseen keskustellessani uuden asiakkaan kanssa.

Ellie edustaa kuitenkin uudentyyppistä ja edistyksellistä ajattelua, jota voimme kutsua mallipohjaiseksi tai liiketoimintalähtöiseksi tietovarastoinniksi.

IT-asiantuntija saattaa alkuun vierastaa tätä ajattelua. Pitääkö meidän todella käyttää Ellietä liiketoiminnan kanssa?

Uskon, että tämä kannattaa, koska liiketoiminta itse asiassa pitää siitä, että voi kertoa jollekin mitä oman alueen käsitteet tarkoittavat. Lisäksi mallinnusistunnot ovat usein innostavia – kerrankin puhutaan vain busineksesta ja datasta, ei siis lainkaan tietotekniikasta.

Ellie on suunniteltu helpoksi käyttää. Liiketoiminta ei vierasta sitä. Vaikkeivat he malleja itse loisikaan, he osallistuvat käsitteiden määritykseen mielellään.

He vierastavat erittäin paljon teknisiä välineitä, kuten esim WhereScapea tai Erwinia. Kummatkin ovat toki hyviä työkaluja, mutta eri käyttötarkoitukseen.

Koittakaapa näyttää tietokannan tietomalleja liiketoiminnalle ja kysykää mitä ajatuksia ne herättävät.

Hieno asia Elliessä on se, että nyt saamme nämä määritykset (käsitemallit) suoraan dataputkeen, eli ne voidaan koneellisesti lukea toiseen järjestelmään (esim WhereScapen homma toimii jo nyt kun rasvattu) joista niistä tehdään tietomalli.

Tämä on monelle Ellie-käyttäjälle mahtavaa ja minusta mullistaa koko tietovarastoinnin: ensimmäistä kertaa liiketoimintamääritykset saadaan automaattisesti putkeen mukaan!

Yksi Ellien vahvuus tulee juuri data vault – vastaavuudesta.

Ellien mallit on suunniteltu niin, että ne voidaan kääntää data vault-rakenteeksi tiettyjen sääntöjen mukaan esim WhereScapessa. Vau, vaikka itse sanonkin!

Ellie tehostaa prosessia

Asiakas sanoi että säästää valtavasti aikaa Ellien avulla. Miten se tapahtui, kysyin.

He kertoivat kuinka kova homma on juosta liiketoiminnalta nämä määritykset ja suhteet kasaan.

Pahimmillaan tämä tehdään moneen kertaan. Uusi juuri aloittanut BI-kehittäjä tulee taas kysymään, mitä eri käsitteet tarkoittavat.

Ja siihen päälle kaikki kommunikointi, dokumentointi ja versionhallinta. Elliestä oli tässä valtava apu.

Ei ihme, että ympäri maailmaa ihmiset ovat minuun yhteydessä että mikä tämä juttu on mitä te siellä Suomessa värkkäätte.

Mallipohjainen ja data vaultiin perustuva tietovarastointi on nyt muodissa.

Tietovarastotoimittaja Snowflake on maailman arvokkain yksittäinen teknologiafirma. Ellie sopii juuri Snowflake-tietovaraston suunnitteluun kun nenä päähän.

Tuomme Ellieen myös tähtimallit sekä eri tason mallit, joiden avulla tuemme entistä enemmän end-to-end putkea.

Tarvitaanko Ellietä?

Kun tehdään uutta, niin totta kai kohtaan skeptisyyttä. Tarvitaanko Ellietä todella? Dataputken rakentamisessa on eri vaiheita eikä Elliellä tehdä kaikkea.

Osa rakentaa toista kohtaa putkesta, ja käyttää siihen kohtaan soveltuvaa välinettä – eri työkaluja tarvitaan eri tarkoituksiin.

Osan mielestä käsitemalleja tai määrityksiä ei tarvita lainkaan. Toivotan heille onnea, koska sitä he nimittäin tarvitsevat arvuutellessaan liiketoiminnan ajatuksia.

Toisten mielestä ne voidaan tehdä fläppitaululle, powerpointilla tai muun vaatimusmäärittelyn yhteydessä muistivihkoon.

Entä sellaiset työkalut kuin Visio tai Lucidchart? Ne ovat hyviä diagrammien piirtämiseen ja tämä on oikea suunta.

Mutta onko niissä Business Glossarya? Ovatko eri mallit yhteydessä toisiinsa siten, että voit muodostaa kuvan koko organisaation datavarannoistasi? Voiko niihin importata attribuutteja? Tukevatko ne data vaultia? Viedäänkö niiden mallit suoraan dataputkeen?

Vastaus on ei.

Ellie on kehitetty yhteen use caseen: tietovarastot ja BI.

Ellien fanikunta kasvaa

Ellie on tehty oikeiden asiakkaiden kanssa vastaamaan oikeisiin tarpeisiin tietovaraston toteutuksissa.

Koska Ellie edustaa uutta ajattelua, siinä käy seuraavasti: aluksi ollaan epävarmoja että mihin Ellietä tarvitaan, onhan sitä ennenkin pärjätty ilman. Käyttöönoton jälkeen Elliestä ei haluta luopua millään.

Lopulta propellipäisemmätkin koodarit, jotka käyttävät Ellietä, huomaavat sen arvon.

Elämä helpottuu valtavasti kun on määritykset ja tietovaraston pohjapiirustus on saatavilla koko projektin ajan.

Ellieen tuodaan usein myös attribuutit, joten data engineerit rakastavat sitä.

Minulta kysytään välillä Ellien logolla varustettuja tarroja ja sanotaan: “olen Ellien fani”. Kun jonkin asian kehittämiseen pistää koko sydämensä ja joku kysyy tarroja ja kertoo olevansa fani, niin minä liikutun syvästi.

Kiitos kaikille faneille!

Tuomme uusia ominaisuuksia, kun opimme miten ne hyödyttävät asiakasta. Näin pala kerrallaan Elliestä tulee parempi ja kattavampi.

Business Finlandin avulla viedään Ellie ja suomalainen tietovarasto- sekä mallinnusosaaminen maailmalle.

Pois tieltä Snowflaket ja WhereScapet, sinivalkoinen Ellie tulee!

Ps. Katsastakaa Ellien uudet kotisivut tästä!

Ystävällisin terveisin,
Johannes Hovi
CEO, Ellie Technologies Oy

 

Ps. Mikäli haluat oppia hyödyntämään tekoälyä oikeasti, niin nyt siihen on oiva mahdollisuus.

Alan huippuosaaja Tarry Singh tulee Suomeen valmentamaan aiheesta! Nyt pistetään kädet syvälle saveen ja opetetaan konetta datalla aivan itse!

Python machine learning with Tensorflow 2.0, Helsinki 24.03.2020 – 25.03.2020

Koulutuksessa opitaan Googlen kehittämän Tensorflown 2.0 frameworkin hyödyntämistä Pythonilla. Kurssi soveltuu data-ammattilaiselle tai ohjelmistokehittäjille, laajaa koodausosaamista kuitenkaan ei tarvita.

Koulutus nostaa kaikkien datan kanssa työskentelevien osaamisen uudelle tasolle. Opit koneoppimisen kolme perusmenetelmää: Supervised, Semi-Supervised and Unsupervised Learning.

Voit jatkaa harjoittelua kurssin jälkeen omatoimisesti ja vain taivas on rajana, kun pääset itse mylläämään dataa.
Kukapa ei haluaisi laittaa ansioluetteloon Tensorflown ja koneoppimisen taitoja!

Haluatko olla data-alan aallonharjalla?
Tule siis tutustumaan koneoppimiseen käytännössä!

Saattaisit olla kiinnostunut myös näistä

Ketterä kehitys

Python machine learning with Tensorflow 2.0

Lue lisää
Datan hallinta

Data Vault 2.0 Bootcamp + Certification

Lue lisää