Opi hands-on-tekemisen kautta ymmärtämään Sparkin keskeiset käyttötavat ja ota ensiaskeleet Sparkin käyttöön. Kuule Sparkin taustat, nykytila ja tulevaisuus, opi keskeiset Sparkin hyödyntämisessä tarvitut analytiikkakomponentit, Spark -työskentelyä helpottavat asiantuntijaverkostot, työskentely-ympäristöt ja dokumentaation lähteet.
Kurssin perusedellytyksinä ovat ohjelmoinnin perusteet, terminaali ei saa pelottaa. Kurssin esimerkeissä käytetään Scalaa ja Pythonia, koodiesimerkkien kuitenkin tullessa opettajalta. Käytännön harjoituksiin keskittyvän kurssin aikana käydään esimerkkidataa käyttäen läpi useita analytiikan perustilanteita Sparkilla, valmiita koodiesimerkkejä käyttäen, näin valmistaen käyttäjä omien analytiikkatarpeidensa täyttämiseen jatkossa.
Kouluttajana on Suomen kokeneimpiin tiedonhyödyntämisosaajiin kuuluva Manne Laukkanen Smart Data Hubista. Hänellä on pitkä käytännön kokemus Big Data -analytiikan hyödyntämisestä mm. Nokialla, Fonectalla ja useissa muissa yrityksissä.
Kenelle:
Kaikille Sparkilla käytännön tekemisestä kiinnostuneille.
Esitiedot:
Perustiedot ohjelmoinnista ja analytiikasta.
Sisältö:
Intro: Sparkin taustat, perusteet, miten dataprosessointi Spark klusterissa pääosin toimii.
Pystytämme Sparkin labraympäristössä, jotta se onnistuu kurssin käyneiltä itseltään tarvittaessa.
Hyvät käytännöt Sparkin käytössä, dokumentaatiot, resurssit (mm. DataBricks).
Spark-töiden hallinta: Mesos vs. standalone
Hands-on MLLibin analytiikka/algoritmitarjooma esimerkkeineen eri datojen kanssa, streaming, ”reaaliaikainen” analytiikka.
Esimerkit Scalalla, mutta myös python ja SQL -esimerkkejä käydään läpi, jotta kurssilaiset saavat tarvittavat työkalut jatkoa varten eri käyttötapauksiin.