Esittely
Kurssi on saatavana myös yrityskohtaisena. Lisätiedustelut [email protected] tai 050 3670809.
Data Platform on jokaisen data driven -organisaation perusedellytys. Siihen liittyy keskeisesti ei-strukturoidun datan kerääminen ja hyödyntäminen. Big Data on ehkä terminä kokenut inflaation, mutta isojen datamassojen hyödyntäminen on ajankohtaisempaa kun koskaan.
Data Laken on Hadoop-pohjainen ratkaisu ei-strukturoidun tiedon talletukseen ja analysointiin. Se on tällä hetkellä suositeltava arkkitehtuuriratkaisu aina, kun suunnittelemme Data Platformia, eli laajennettua tietovarastoa. Aivan jokainen vähänkään isompi yritys tulee käsittelemään suurempaa ulkoista datamassaa tulevaisuudessa, joten aihe on erittäin ajankohtainen. Katso tästä videosta lisätietoa Data Platformista ja sen toteutuksesta.
Tule oppimaan Data Laken toteutus käytännössä!
Kurssin tarkoituksena on syventää osallistujien ymmärrystä Hadoopista (järjestämme myös Hadoop-peruskurssin, jossa opit perustee käytännössä= sekä sen hyödyntämisestä tietovarastoinnissa käytännön työasemaharjoituksiin perustuvan oppimisen kautta. Vaikka painopiste on todenmukaisissa, käytännön harjoitustehtävissä, kahden päivän mittainen masterkurssi sisältää myös teoriaa ja taustoitusta Hadoopista.
Kurssilla toteutetaan todenmukainen, pilvipohjainen Data Lake harjoitustehtävien kautta. Data Lake –konseptin lisäksi kurssin aikana opitaan Hadoop-ekosysteemin yleisimmin käytetyt tuotteet kuten esimerkiksi Hive, Pig ja Sqoop sekä Hadoop-pohjaisen tietovarastoinnin edistyksellisiä menetelmiä, mm. Hadoopin käyttö suorituskykyisenä ETL-työkaluna ja raakadatan prosessorina, Hive-taulujen partitiointitekniikat, taulujen välisten liitosten suorituskyvyn optimointi sekä pilvitietovaraston hyödyntäminen tietovarastoinnissa.
Lue lisää Hadoopista tietovarastoinnissa ja Data Lake –konseptista kouluttajan, Karri Pulkkisen blogista https://www.arihovi.com/hadoopin-rooli-tietovarastoinnissa/.
Kenelle:
Tietovarastosuunnittelijoille ja -toteuttajille, DW/BI-asiantuntijoille, Big Data -asiantuntijoille, DBA:ille, arkkitehdeille.
Esitiedot:
Hadoop-peruskurssin suorittaminen tai Hadoop-perustuntemus on eduksi, mutta ei välttämätöntä.
Sisältö
- Hadoop-klusterin arkkitehtuuri, infrastruktuurivaihtoehdot, distribuutiot
- Pilvipalvelupohjaisen Hadoop-klusterin perustaminen
- Klusterin konfigurointi ja valvonta
- Klusterin suorituskyky ja tietoturva
- Hadoop-pohjaisen tietovaraston arkkitehtuuri
- Edistyneet tietovarastointimenetelmät ja parhaat käytännöt
- Data Lake –konsepti
- NoSQL-tietokannat

Kieli:
SuomiKesto:
2 PäivääPaikka:
Nortrain, Opastinsilta 12 F, Pasila, HelsinkiKoulutusohjelmalla / kurssilla ei ole aktiivisia aloituspäivämääriä, jos olet kiinnostunut kurssista ota yhteyttä.
Ota yhteyttäOttakaa yhteyttä: