15.05.2018

Käännä GDPR kilpailueduksi

Hei,

Meillä oli taannoin GDPR:än erikoistunut lakimies Erkka Pälä konsultoimassa hieman, että miten asetus vaikuttaa meidän toimintaamme. Kaveri toimii meilläkin kouluttajana ja konsultoi aiheesta esim. suomalaisia pörssiyrityksiä

Paha GDPR?

Kaikki varmaan tietävät mistä on kyse kun puhutaan GDPR:stä. Tässä se ilmaistu yhdellä lauseella Erkan suusta kuultuna: ”Henkilötietojen käsittelyn sääntely uudistuu ja yhtenäistyy Euroopassa, kun Euroopan unionin uusi tietosuoja-asetus 25.5.2018 alkaen muuttaa tietosuojan oikeudellisen perustan”

GDPR nähdään työläänä, ehkä jopa hieman uhkaavana muutoksena. Se aiheuttaa työtä, joka ei lisää kasvua eikä pienennä kustannuksia, vaan päinvastoin  lisää niitä. Toisaalta yksityisyyden suoja on nyt pinnalla. Facebookin skandaalin jälkeen ihmiset ovat ehkä tietoisempia, kuin ennen.

Monelle tulee hoppu asian kanssa ja osa sen edellyttämistä muutoksista on haastavia toteuttaa. Yritysten pitäisi pystyä neuvottelemaan sopimuksia uudestaan amerikkalaisten ohjelmistojättien, kuten Microsoftin tai Amazonin kanssa. Ja se ei tule olemaan helppoa, koska heidän vinkkelistä isokaan suomalainen yritysasiakas ei ole yksin kovin merkittävä.

Sitten jos kaikki eurooppalaiset suuryritykset vaatisivat yhdessä rintamassa muutoksia, niin se voi toimia. Mutta se ei ole tämän kirjoituksen idea, enkä mene syvemmälle näihin sopimuskiemuroihin. Erkka on erittäin pätevä kaveri. Voin antaa yhteystiedot, jos on tarvetta selkokieliselle asiantuntijalle.

Erkkaa kuultuani oivalsin kuitenkin todella positiivisia asioita tästä paljon puhutusta ja pelätystä asetuksesta. Kerron kohta, miten asetuksen noudattaminen nopeuttaa datan ja tekoälyn hyödyntämistä.

Mutta ensin hieman perusteita.

Mitä pitää tehdä?

Asetuksen mukaan yritysten pitää kertoa, mitä tietoja heillä on henkilöistä, missä IT-järjestelmissä niitä säilytetään sekä mihin tarkoitukseen tietoja käytetään. Tyypillisesti henkilörekistereitä pidetään yrityksen omasta henkilöstöstä, asiakkaista sekä yhteistyökumppaneista (tai heidän edustajista, koska laki koskee henkilöitä). Myös kaikki aikaisemmat työntekijät, asiakkaat ja kumppanit kuuluvat lähtökohtaisesti tähän.

En nyt tässä lähde kovin tarkkaan analysoimaan asetuksen yksityiskohtia, mutta periaate on tämä.

On mahdollista, että henkilötiedoista vastaavalla on satoja IT-järjestelmiä tai sähköisiä rekistereitä, joissa henkilötietoja säilytetään. Osa näistä on järjestelmistä on ikivanhoja.  Voit varmaan kuvitella esimerkiksi ison pankin kaikkia historiansa aikana käyttämiä ATK-laitteita, joiden pääkäyttäjät ovat eläköityneet jo kauan sitten.

Jos pyydän nyt esim Nordealta minun tietojani, niin kuukauden sisällä heidän pitäisi pystyä toimittamaan nämä tiedot. Samoin tietysti kaikkien muiden yritysten, me mukaan lukien. GDPR sisältää lisäksi joukon muita haastavia vaatimuksia, joiden rikkomisesta voi pahimmillaan saada sakon, jonka suuruus on 20 miljoonaa tai tai 4 % liikevaihdosta, kumpi näistä onkaan suurempi.

Sitten on vielä sellainen asia, eli lain noudattaminen voi olla poliittisesti latautuneelle yritykselle vieläkin haastavampaa. Sanotaan vaikka turkistarhausyritykset. Jos sinne tulee yllättäen sata tietopyyntöä kerralla, niin yrityksen toiminta voi oikeasti lamaantua kunnolla.

GDPR on myös mahdollisuus

Nyt yritysten siis pitää kiireen vilkkaa selvittää, mitä henkilötietoja heillä on ja missä järjestelmissä. Yhtäkkiä Erkan puheet rupesivat kuulostamaan tutulta. Kuvaa datasi ja selvitä niiden sijainnit. Sehän on juuri sitä mitä me teemme ja mihin olemme kehittäneet Hovi Data Frameworkin (HDF)

HDF on kuitenkin alunperin kehitetty datan parempaan hyödyntämiseen, eli jos kuvaat datasi ja tiedät niiden sijainnit, niin olet jo tehnyt aika ison osa Data Governance-, tietoarkkitehtuuri- tai Master Data Management -tyyppisistä hankkeista.  Myös tietovarastojen – ja alustojen toteuttaminen on tämän jälkeen paljon nopeampaa.

Toisin sanoen, kun toteutat GDPR-asetuksen mukaisia muutoksia, saat isompaa hyötyä kuin arvaatkaan. GDPR:n vuoksi on välttämätöntä selvittää missä kaikissa järjestelmissä on päällekkäistä henkilötietoa. Selvityksen jälkeen voi joissakin tapauksissa olla mahdollista sulkea useista järjestelmistä yhtä lukuunottamatta kaikki – toimenpide joka olisi kannattanut tehdä jo vuosia sitten.

Yritykset voivat  saavuttaa merkittäviä säästöjä, kun joudutaan käymään läpi vihdoin kaikki legacy-järjestelmät ja päällekkäisyydet.

Säästöt voivat olla vain jäävuoren huippu: Kun asiakasdata on hallussa ja päällekkäisyydet karsittu, on huomattavasti suoraviivaisempaa hyödyntää edistyneen analytiikan ratkaisuja.

Tämän tehtyäsi oletkin lähempänä Googlen tai Amazonin käytäntöjä ja tekoälyn  hyödyntäminen on oikeasti niin paljon helpompaa.

Aika rohkea väite, mihin tämä perustuu?

GDPR ja tekoäly

Jos olet kuvannut datavarantosi, eli nimennyt vaikka asiakastiedot, määrittänyt niiden väliset yhteydet muuhun liiketoimintaa sekä selvittänyt lähdejärjestelmät, olet tehnyt jo yllättävän ison osan myös tekoälyprojektista. Itse asiassa tämä on se isoin ja merkityksellisin osa, koska tässä vaiheessa tulee ne isot virheet, joiden korjaaminen on vaikeaa myöhemmin.

Tekoälykehittäjä haluaa tehdä esimerkiksi avainasiakkaiden palvelemiseen automatisoidun markkinointikampanjan. Jos tekoälykehittäjät eivät tiedä mitä tarkoitetaan ‘avainasiakkaalla’ ja miten se eroaa ‘ostavasta asiakkaasta’ tai nettisivuilla kirjautuneesta ‘ei-ostavasta asiakkaasta’, niin hankkeesta ei tule mitään. Hän kaivaa väärää dataa väärästä paikasta ja dataan ei voi luottaa.

Toki liiketoiminta ja asiantuntijat voivat tehdä edellä kuvatut määritykset aina jokaisen projektin kohdalla erikseen. Kuitenkin yritys, joka on kuvannut ja kartoittanut datavarantonsa etukäteen, toteuttaa muita erittäin paljon ketterämmin tekoälyprojekteja. On siis toisin sanoen edellä kilpailijoitaan.

Kun tiedämme mistä löydämme datat ja voimme luottaa siihen, että tämä data todella on sitä oikeaa dataa (esim avainasiakkaasta, eikä jostain muusta käsitteestä), työ on tämän jälkeen hyvin mekaanista, eli datan putsausta, koneoppimisen hyödyntämistä sekä (toivottavasti) näiden oivallusten automatisointia.

Kehitämme ”vahingossa” apuvälinettä GDPR-toteutuksiin

Kuten blogiemme lukijat tietävät, olemme kehittämässä pilvipohjaista Ellie nimistä työkalua juuri datakartoitukseen, eli esimerkiksi henkilötietojen kuvaukseen. Kun rakennamme sitä alusta asti itse, niin teemme siitä suoraan GDPR yhteensopivan. Ellie on siten erilaisten dataprojektien suunnitteluun soveltuva väline, jonka ydin on Hovi Data Frameworkin muuttamisessa digitaaliseen muotoon.

Elliessä ylläpidetään myös tietoa siitä, missä IT-järjestelmissä tai muussa sähköisessä muodossa ovat vaikkapa asiakastiedot. Sitten kattavan google-tyyppisen hakuominaisuuden kautta voimme selvittää kiinnostuksen kohteena olevien tietojen sijainnit todella helposti.

Tekoälyasiantuntija voi toteuttaa projektia fyysisesti eri lokaatiosta käsin, hän vain käy katsomassa määritykset sekä datojen lähdejärjestelmät Elliestä. Ehkä tähän päälle kysyy jotain lisäkysymyksiä myyntijohtajalta, joka tietää avainasiakkaan määritelmän. Hänenkin sähköposti löytyy Elliestä, eli tekoälyasiantuntija voi työstää asiaa nopeasti ilman, että joudutaan järjestämään monia fyysisiä palavereja liiketoiminnan kanssa.

Ellie on saatavilla kesäkuun lopussa (koodarit painavat kovaa hommia, että pysytään aikataulussa uuden version julkaisun suhteen).

Nyt se on vielä omassa käytössä, eli käytämme sitä työkaluna asiakasprojekteissa, liittyvät ne sitten tekoälyyn, IT-järjestelmien kehitykseen/hankintaan,  Data Governanceen tai laajan tietoalustan suunnitteluun (nyt on todella iso toteutus piirustuspöydällä). Ellie on myös asiakkaan pilottikäytössä, eli saamme heltä kullanarvosta apua kehitykseen.

Yhteenvetona loppuun: vaikka GDPR:n mukaiset muutokset saattavat tuntua kuluerältä, sivutuotteena saatta aiheutua datakyvykkyyden merkittävä kasvu.

Ystävällisin terveisin,

Ari Hovi & tiimi

Ps. Järjestämme nyt ensimmäisenä Suomessa Deep Learning-menetelmään pohjautuvan tekoälyvalmennuksen  – Käytämme koulutuksessa TensorFlowta, joka on kuumin alan teknologia tällä hetkellä.

AI DEVELOMENT IN PRACTICE WITH DEEP LEARNING AND TENSORFLOW 6.6 – 7.6.2018, HELSINKI

Vetäjänä on alan huippu Tarry Singh, joka on ollut tekoälypioneerin Andrew Ng:n opissa. Tämä Courseralle suunniteltu koulutus  on valittu toiselle sijalle Inc -teknologiajulkaisun äänestyksessä maailman parhaista tekoälykursseista.

Koulutus on ainutlaatuinen ja sinne otetaan vain rajoitettu määrä osallistujia. Varaa siis paikkasi ajoissa!

Lue lisää tästä

Saattaisit olla kiinnostunut myös näistä

Datanhallinnan strategiset vaihtoehdot

Lue lisää

Ari Hovi vahvistaa ja laajentaa palveluaan Data Lakehouse -ratkaisujen toimittajana

Lue lisää

Data Lakehouse -arkkitehtuuri

Lue lisää