23.05.2019

Kuka osaa tekoälyä OIKEASTI?

Hei,

Johannes tässä jälleeen kirjoitushommissa, tällä kertaa aiheena on tekoäly.

Tekoälystä on hirveä hype ollut päällä jo useamman vuoden.

Monet eri tahot puhuvat tekoälystä ikään kuin ajatusjohtajan syvällä rintaäänellä, mutta ketä tässä pitäisi kuunnella?

Olen huomannut, että datan ja tekoälyn hyödyntämistä lähestytään erityisesti kolmen eri koulukunnan toimesta: koodarit, tietovarasto/BI-osaajat ja yliopistotutkijat.

Sitten on vielä tv:stä tuttu juontaja ja mainosmies Henkka Hyppönen, joka hänkin on nykyisin tekoälyasiantuntija. Mutta palataan Henkkaan myöhemmin.

Jokainen edellä mainituista ryhmistä hyödyntää työkseen dataa, ja puhuu tekoälystä, mutta siihen yhtäläisyydet usein loppuivatkin.

Käydään läpi hieman läpi, minkälaiset ajatukset muokkaavat Kallen Koodaajan, Timo Tietovaraston  ja Tuula Tutkijan mielenmaisemaa.

Kalle Koodari

Kalle on koodannut koko ikänsä, ollut mukana ensin demoskenessä ja sitten startup-maailmassa. Hän oli jo silloin Slushissa, kun se on vielä katu-uskottava koodarien kokoontumisajo.

Kalle on alunperin web-kehittäjä, mutta lähtenyt kehittämään tekoälyä uuteen AI-startupiin.

Hän kyllä tunnustaa, että tilastotieteen ymmärrys on olennaista, joskin Kalle mielestä koneoppimisen mallien tunteminen on tärkeämpää.

Kalle luonnollisesti osaa koodata, eli tuntee algoritmien logiikan hyvin perusteellisesti.

Hän ottaa haltuun esim TensorFlow tai minkä tahansa open source-systeemin hyvin vaivatta. Ne ovat nimittäin kaikki koodareiden kehittämiä!

Kalle ei kuitenkaan ymmärrä korporaatiomaailmaa juurikaan. Heillä on sovellusten tietomallit  ja arkkitehtuurit omassa päässä ja harvoin dokumentoidaan mitään, agile-kehitys tuli jo äidinmaidossa.

Kalle ei  yleensä jaksa vaivata päätään sillä, että jonkun muun pitää ymmärtää ja kehittää heidän luomaa koodiaan.

Kallen mielestä IBM, Oracle, Microsoft ja SAP on menneen talven lumia. Hän ei ymmärrä, mikä virka näillä dinosauruksilla on yrityksille.

Kallea myös turhauttaa se, että jotkut tekoälyprojektit edellyttävät asioiden ja ihmisen kanssa säätämistä.

Kallesta on uuvuttavaa istua palavereissa ja koittaa perustella asioita ihmisille, jotka eivät ymmärrä koodausta. Kalle väsyykin näissä tilanteissa helposti ja on todella onnellinen, jos joku muu hoitaa vaatimusmäärittelyt ja muut sellaiset.

Vihon viimeinen asia, jossa he haluavat olla mukana, on organisaatio muutoshanke. Eihän se ole koodausta!

Timo Tietovarasto

Timo on tuotannollisten dataratkaisujen erikoisosaaja. Hän rakentaa ns datatuotteita, eli järjestää datat liiketoiminnalle valmiiksi pureskeltuna kulutusta varten.

Datatuotteet rakennetaan Timon visiossa kun tehtaassa, jossa toimintavarmuus ja virheiden karsiminen ovat avainasemassa.

Timo on relaatiopohjaisten tietokantojen suuri kannattaja, koska lähes kaikki kriittiset tietojärjestelmät perustuvat niihin. Ne eivät Timon mukaan tule katoamaan mihinkään.

File-pohjaiset tiedon tallennusmuodot tai data lake eivät ole itse asiassa koskaan kolahtaneet Timolle oikein kunnolla.

SQL on mahtava ja kehittynyt kieli, sitä mieltä Timo on. Oraclen, IBM:n, SAP:n ja Microsoftin tuotteet ovat lähellä sydäntä, koska ne tulevat hallitsemaan Timon mielestä myös tulevaisuuden tekoälymarkkinaa.

Hadoopia on muutenkin salaa haukuttu jo vuosia samanmielisten kanssa. Nyt kun Hadoop ei enää ole pinnalla, Timo miettii, että mitä minä sanoin!

Timo on omasta mielestään oivallisesti hoksannut, että tekoälyn hyödyntäminen on ikään kuin päätepysäkki tietovarasto-BI-datatiede -jatkumolla.

Kaikki tietävät, että tekoälyn hyödyntäminen edellyttää hyvä laatuista dataa ja Timo on pelannut datan kanssa jo vuosikymmeniä.

Hän tietää miten taklataan datan laatuongelmia ja miten se integroidaan keskenään.

Timon mielestä tietovaraston kuntoon laittaminen on edellytys tekoälyn hyödyntämiseen, eli siitä kannattaa aina lähteä liikkeelle.

Tuula Tutkija

Tuula on ollut vuosia yliopistolla tutkijana ja siirtynyt sieltä data scientistiksi pörssiyritykseen. Tilastotiede ja matemaattiset mallit ovat Tuulan erityisalaa.

Jo yliopistossa myllättiin datasettejä SAS:illa ja R:llä. Nyt myöhemmin vaakakuppi on kallistunut Pythonin kannalle.

Tuulalle tuli yllätyksenä, että yrityksillä on niin paljon erilaisia tietokantoja, joiden datan hallinta on hyvin sekavaa. Tuula on kuitenkin haka rakentamaan ennustemalleja liiketoiminnan tueksi, jos vain datasetti on valmiina.

Tuulan nauttii itse datansa mielellään raakana data lakesta käsin. Hän ei ole oikein ikinä ymmärtänyt tietovaraston roolia, mihin sitä tarkalleen ottaen tarvitaan?

Tuula ei itse työssään käytä tietovarastoa ja koko konsepti itse asiassa haiskahtaa joltain aatamin aikaiselta fossiililta. Moderni data laken tulisi korvata se välittömästi.

Jossain vaiheessa Tuulan tekemiä hommia ruvettiin kutsumaan tekoälyksi, joka alkuun hieman huvitti Tuulaa.

Sitten Tuula siirtyi konsulttiyrityksen palvelukseen, jossa päätettiin panostaa tekoälyyn ja näin hänestä tuli tekoälyasiantuntija.

Tuulaa ärsyttäää se, etteivät muut ymmärrä matemaattisten mallien keskeisiä periaatteita, koska ilman niitä tekoälyä ei olisi.

Tuulan mielestä myös business intelligence -ihmiset ovat täysin pihalla mistä data sciencessä on kyse, eihän se ole lainkaan sama asia!

Vielä ärsyttävämpää on se, ettei asiakasyritykset osaa viedä tuotantoon toimivia koneoppimisen malleja juuri lainkaan.

Vaikka ollaan löydetty selkeä tieteeseen perustuva tutkimustulos, liiketoiminta ei vaan osaa hyödyntää sitä eikä mikään käytännössä muutu.

Kuka on oikeassa?

Välillä on jännä huomata, kuinka eri maailmoista nämä ihmiset tulevat. He eivät tunne toistensa termejä ja ajatusmaailmaa.

Kalle, Timo ja Tuula ovat myös kaikki tavallaan omilla tahoillaan oikeassa. Toisaalta he ovat väärässä ja katsovat maailmaa kapeiden linssien läpi.

Totuus on se, että Kalle Koodarien ja Tuula Tutkijoiden pitää ymmärtää konsernien maailmaa, joissa on käytössä IBM:t ja muut isot vendorit.

Korporaatioiden tiedonhallinnassa on pohdittu pitkään datan hyödyntämisen hallintaa ympäristössä, jossa on satoja erillisiä IT-järjestelmiä ja lukuisia eri käyttäjäryhmiä sekä tarpeita.

Tuulalle tiedoksi, että dataa hyödyntävät myös sellaiset ihmiset, joilla ei ole data scientistin taitoja. Moneen tarkoitukseen datan tulee olla pidemmälle jalostettua, kun Tuulan maailmassa.

Pelkät ad hoc-ja open source-systeemit johtava isoon määrään päällekkäistä työtä, sekavuuteen sekä valtaviin kustannuksiin. Plus sellainen pieni juttu, että kukaan muu paitsi Kalle ei osaa käyttää luomaansa viritystä.

Korporaatiomailmassa on yhteiskäyttöisiä järjestelmiä, optimointia, dokumentointia sekä toimintaohjeita. Sorry vain herra huippukoodaridatavelho, näin maailma makaa, isot yritykset toimivat eri tavoin kun startupin.

Toisaalta korporaatiomaailman on entistä enemmän opeteltava hyödyntämään open source-välineitä sekä oppia itse kehittämään tekoälyä startup -tyyliin kokeilukulttuuria hyödyntämällä.

Yritykset eivät voi vain ulkoistaa osaamista ja kysyä esim SAP:lta että voitteko auttaa meitä hyödyntämään tekoälyä. Kuulostaa utopistiselta, mutta yritysten pitää mielestäni oikeasti omin käsin kehittää tekoälysovelluksia omalle toimialueelleen.

Timo Tietovaraston pitää myös tulla ulos relaatiomaailmasta ja oppia ymmärtämään kehittyneitä datan hyödyntämisen menetelmiä, open sourcea, strukturoimatonta dataa sekä reaaliaikaista data-analytiikkaa.

Timon pitää kiireen vilkkaa päivittää osaamistaan, koska maailma on muuttunut pysyvästi, eikä entiseen ole paluuta.

Yhteistyö on se juttu

Minusta näitä kaikkia osaajaryhmiä kuitenkin tarvitaan, mikäli iso organisaatio haluaa hyödyntää tekoälyä oikeasti.

Paras ratkaisu on tuoda nämä ryhmät yhteen siten, että he oppivat toistensa näkökulmia.

Nämä näkökulmat ovat muotoutuneet pitkän ajan kuluessa, eli sinun pitää ymmärtää näiden ryhmien taustat ja historia, jotta voit todella astua heidän saappaisiinsa.

Ja tarvitsemme näiden lisäksi muutosjohtamisen osaamista saadaksemme yhtään mitään oikeasti vaikuttavaa aikaiseksi. Eli tervetuloa mukaan tekoälyjuhliin, Maija Muutosjohtaja!

Loppuun vielä eräs tuikitärkeä asia: No offence, mutta Kalle, Timo ja Tuula ovat surkeita myymään ajatuksiaan johdolle.

Näin ollen myös Henkka Hyppöstä tarvitaan, koska hän osaa mainosmiehenä asetella sanansa johdolle ja myydä tekoälyn hyödyntämisen heille.

Sieltä tulee nimittäen Tuulan, Timon ja Kallen budjetit. Joten, Johanna Johtaja, takkia narikkaan ja käy peremmälle juhliin!

Nyt puhutaan paljon Data Governancesta, eli ikään kuin säännöistä ja hallintamalleista datan hyödyntämiselle.

Minusta pitäisi puhua Data & AI Collaboration -konseptista, eli miten saadaan eri ryhmät kommunikoimaan paremmin keskenään.

Aiheeseen liittyen, meillä on muuten nyt hyvä koulutustilaisuus tulossa, jonka avulla kuka vain voi tutustua tekoälyn kehittämiseen itse. Koulutuksessa tehdään käytännön harjoituksia, mutta se ei vaadi erityisiä koodaustaitoja.

Käytämme koulutuksessa TensorFlowta ja PyTorchia, jotka ovat kuumimpia  teknologioita tällä hetkellä. Kannattaa tutustua:

AI Development in Practice with Deep Learning and TensorFlow and PyTorch, 5.6 – 6.6.2019, Helsinki

Vetäjänä on alan huippu Tarry Singh, joka on ollut tekoälypioneerin Andrew Ng:n opissa. Tämä Courseralle suunniteltu koulutus  on valittu toiselle sijalle Inc -teknologiajulkaisun äänestyksessä maailman parhaista tekoälykursseista.

Lue lisää tästä

Saattaisit olla kiinnostunut myös näistä

Data Lakehouse -projektit käytännössä: Kokemuksia asiantuntijoilta

Lue lisää

Eettinen tiedonkäyttö: Vastuullisuuden peruspilarit

Lue lisää

Tieto on valtaa – ja vastuuta

Lue lisää